Un dé à 6 faces est lancé de manière itérative. Quel est le nombre attendu de rouleaux requis pour faire une somme supérieure ou égale à K?
Avant de modifier
P(Sum>=1 in exactly 1 roll)=1
P(Sum>=2 in exactly 1 roll)=5/6
P(Sum>=2 in exactly 2 rolls)=1/6
P(Sum>=3 in exactly 1 roll)=5/6
P(Sum>=3 in exactly 2 rolls)=2/6
P(Sum>=3 in exactly 3 rolls)=1/36
P(Sum>=4 in exactly 1 roll)=3/6
P(Sum>=4 in exactly 2 rolls)=3/6
P(Sum>=4 in exactly 3 rolls)=2/36
P(Sum>=4 in exactly 4 rolls)=1/216
Après modification
P(Sum>=1 in atleast 1 roll)=1
P(Sum>=2 in atleast 1 roll)=5/6
P(Sum>=2 in atleast 2 rolls)=1
P(Sum>=3 in atleast 1 roll)=4/6
P(Sum>=3 in atleast 2 rolls)=35/36
P(Sum>=3 in atleast 3 rolls)=1
P(Sum>=4 in atleast 1 roll)=3/6
P(Sum>=4 in atleast 2 rolls)=33/36
P(Sum>=4 in atleast 3 rolls)=212/216
P(Sum>=4 in atleast 4 rolls)=1
Je ne suis pas sûr que ce soit correct tout d'abord et mais je pense que cette probabilité est liée au nombre de rouleaux attendu?
Mais je ne sais pas comment continuer. Suis-je dans la bonne direction?
self-study
mean
expected-value
dice
saddlepoint-approximation
Suspect habituel
la source
la source
Réponses:
Il ne s'agit pour l'instant que de quelques idées pour une autre approche, plus exacte, basée sur le même constat que ma première réponse. Avec le temps, je prolongerai cela ...
Tout d'abord, une notation. Soit un entier donné (grand) positif. Nous voulons que la distribution de , qui est le nombre minimum de lancers d'un dé ordinaire pour obtenir la somme d' au moins . Donc, nous définissons d'abord comme le résultat du lancer de dés , et . Si nous pouvons trouver la distribution de pour tout alors nous pouvons trouver la distribution de en utilisant et nous sommes terminé.N K X i i X ( n ) = X 1 + ⋯ + X n X ( n ) n NK N K Xje je X( n )= X1+ ⋯ + Xn X( n ) n N
Maintenant, les valeurs possibles pour sont , et pour dans cette plage, pour trouver la probabilité , nous besoin de trouver le nombre total de façons d'écrire comme une somme d'exactement entiers, tous dans la plage . Mais cela s'appelle une composition entière restreinte, un problème bien étudié en combinatoire. Quelques questions connexes sur les mathématiques SE se trouve par https://math.stackexchange.com/search?q=integer+compositions n , n + 1 , n + 2 , … , 6 n k P ( X 1 + ⋯ + X n = k ) k n 1 , 2 , … , 6X1+ ⋯ + Xn n , n + 1 , n + 2 , … , 6 n k P( X1+ ⋯ + Xn= k ) k n 1 , 2 , … , 6
Donc, en recherchant et en étudiant cette littérature combinatoire, nous pouvons obtenir des résultats précis et silencieux. J'y reviendrai, mais plus tard ...
la source
Il existe une formule fermée simple en termes de racines d'un polynôme de degré 6.
Il est en fait un peu plus facile d'envisager un dé de foire général avec faces étiquetées avec les nombresré≥ 2 1 , 2 , … , d.
Soit le nombre attendu de rouleaux nécessaires pour égaler ou dépasser Pour Sinon, l'attente est une de plus que l'attente du nombre de rouleaux pour atteindre la valeur immédiatement précédente, qui serait parmi oùek k . k ≤ 0 , ek= 0. k - d,k−d+1,…,k−1,
Cette relation de récurrence linéaire a une solution sous la forme
où les sont les racines complexes du polynômeλi d
Les constantes sont trouvées en appliquant la solution aux valeurs où dans tous les cas. Cela donne un ensemble d' équations linéaires dans les constantes et il a une solution unique. Que la solution fonctionne peut être démontrée en vérifiant la récurrence utilisant le fait que chaque racine satisfaitai (2) k=−(d−1),−(d−2),…,−1,0 ek=0 d d (1) (3):
Cette solution sous forme fermée nous donne de bons moyens d'approximer la réponse ainsi que de l'évaluer avec précision. (Pour les valeurs petites à modestes de l'application directe de la récurrence est une technique de calcul efficace.) Par exemple, avec nous pouvons facilement calculerk, d=6
Pour les approximations, il y aura une racine unique plus grande donc finalement (pour un suffisamment grand ) le terme dominera les termes dansL'erreur diminuera de façon exponentielle selon la deuxième plus petite norme des racines. Poursuivant l'exemple avec le coefficient de est et la norme la plus petite suivante est ( passant , les autres ont tendance à être très proches de en taille.) Ainsi, nous pouvons approximer la valeur précédente commeλ+=1 k λk+ d (2). k = 6 , λ + a + = 0,4761905 0,7302500. a i 1k=6, λ+ a+=0.4761905 0.7302500. ai 1
avec une erreur de l'ordre de0.7302500106≈10−314368.
Pour démontrer à quel point cette solution est pratique, voici duek k d d≫100
R
code qui retourne une fonction pour évaluer pour tout (dans le cadre des calculs en virgule flottante double précision) et pas trop grand (il s'embourbera une fois ):À titre d'exemple de son utilisation, il calcule ici les attentes pourk=1,2,…,16:
L'objet qu'il renvoie inclut les racines et leurs multiplicateurs pour une analyse plus approfondie. Le premier composant du tableau des multiplicateurs est le coefficient utileλi ai a+.
(Si vous êtes curieux de savoir à quoi
die
servent les autres paramètres , exécutezdie(2, 2, 0, c(1,0))$f(1:10)
et voyez si vous reconnaissez la sortie ;-). Cette généralisation a aidé à développer et à tester la fonction.)la source
die
donne une erreur pour moi:object 'phi' not found
.phi
àa
) pour correspondre au texte était le coupable. Je l'ai corrigé (et vérifié).il n'y a aucun moyen d'obtenir le nombre exact de rouleaux attendus en général, mais pour un K.
Soit N l'événement du roulement attendu pour obtenir somme => K.
pour K = 1, E (N) = 1
pour K = 2,E(N)=(56+2∗1)/(56+1)=1711
etc.
Il sera difficile d'obtenir E (N) pour les gros K. Par exemple, pour K = 20, vous devrez vous attendre à (4 rouleaux, 20 rouleaux)
Le théorème de limite centrale sera plus bénéfique avec un certain% de confiance. comme nous le savons, l'occurrence est uniformément distribuée, pour les grandes valeurs de K. (Distribution normale)
Maintenant, vous avez besoin de "N" pour obtenir Sum au moins K .... nous le convertissons en distribution normale standard. où % Vous pouvez obtenir des valeurs Z à partir des "tables normales standard" ou d'ici par exemple
Vous connaissez K, Z (à toute erreur) ........ alors vous pouvez obtenir N = E (N) à un certain% de confiance en résolvant l'équation.
la source
Je vais donner une méthode pour trouver une solution approximative. Soit d'abord la variable aléatoire, "résultat du lancer avec les dés" et soit le nombre de lancers nécessaires pour atteindre une somme d'au moins . Nous avons alors que donc pour trouver la distribution de nous devons trouver les convolutions des distributions de pour , pour tout . Ces convolutions peuvent être trouvées numériquement, mais pour les grandsXi i N k P(N≥n)=P(X1+X2+⋯+Xn≤k) N Xi i=1,2,…,n n n cela pourrait être beaucoup de travail, alors nous essayons plutôt d'approximer la fonction de distribution cumulative pour les convolutions, en utilisant des méthodes de point de selle. Pour un autre exemple de méthodes de point de selle, voir ma réponse à la somme générique de variables aléatoires gamma
Nous utiliserons l'approximation de Lugannini-Rice pour le cas discret, et suivons R Butler: "Saddlepoint Approximations with Applications", page 18 (deuxième correction de continuité). Tout d'abord, nous avons besoin de la fonction de génération de moment de , qui est Ensuite, la fonction génératrice de cumul pour la somme de dés indépendants devient et nous avons également besoin des premières dérivées de , mais nous trouverons celles qui utilisent symboliquement R. Le code est le suivant:Xi M(T)=EetXi=16(et+e2t+e3t+e4t+e5t+e6t) n Kn(t)=n⋅log(16∑i=16eit) K
Ensuite, nous devons résoudre l'équation du point de selle.
Cela se fait par le code suivant:
Notez que le code ci-dessus n'est pas très robuste, pour les valeurs de loin dans l'une ou l'autre queue de la distribution, il ne fonctionnera pas. Ensuite, un code pour calculer réellement la fonction de probabilité de queue, approximativement, par l'approximation de Luganini-Rice, après Butler, page 18, (deuxième correction de continuité):k
Fonction de retour de la probabilité de queue:
#
Essayons ensuite de l'utiliser pour calculer un tableau de la distribution, basé sur la formule où est la fonction du code R ci-dessus.P(N≥n)=P(X1+X2+⋯+Xn≤k)=1−P(X1+⋯+Xn≥k+1)=1−G(n,k+1) G
Maintenant, laissez-nous répondre à la question d'origine avec . Ensuite, le nombre minimum de rouleaux est de 4 et le nombre maximal de rouleaux est de 20. La probabilité que 20 rouleaux soient nécessaires est très petite et peut être calculée exactement à partir de la formule binomiale, je laisse cela au lecteur. (l'approximation ci-dessus ne fonctionnera pas pour ).K=20 n=20
Donc, la probabilité que soit approximée parN≥19
La probabilité que soit approximée par:N≥10
Etc. En utilisant tout cela, vous pouvez obtenir vous-même une approximation de l'attente. Cela devrait être bien meilleur que les approximations basées sur le théorème de la limite centrale.
la source