Je jette un dé équitable. Chaque fois que j'obtiens un 1, 2 ou 3, j'écris un «1»; chaque fois que j'obtiens un 4, j'écris un «2»; chaque fois que j'obtiens un 5 ou un 6, j'écris un «3».
Soit le nombre total de lancers dont j'ai besoin pour que le produit de tous les nombres que j'ai notés soit . Je veux calculer (ou approximer) , et une approximation peut être donnée en fonction de la distribution normale.
Tout d'abord, je sais que parce que . Maintenant, soit , et le nombre de fois où j'ai noté 1, 2 et 3, respectivement. Alors:
Ce que je veux calculer, c'est:
Comment puis-je calculer cela?
--ÉDITER:
Il a donc été suggéré de remplacer la condition par:
où , , et .
Cela semble plus résoluble! Je n'ai malheureusement toujours aucune idée de comment le résoudre.
la source
Réponses:
La présente question est un cas spécifique où vous avez affaire à une quantité qui est une fonction linéaire d'une variable aléatoire multinomiale. Il est possible de résoudre votre problème exactement en énumérant les combinaisons multinomiales qui satisfont l'inégalité requise et en additionnant la distribution sur cette plage. Dans le cas où est grand, cela peut devenir impossible à calculer. Dans ce cas, il est possible d'obtenir une distribution approximative en utilisant l'approximation normale au multinomial. Une version généralisée de cette approximation est présentée ci-dessous, puis elle est appliquée à votre exemple spécifique.N
Problème général d'approximation: Supposons que nous ayons une séquence de variables aléatoires échangeables de gamme . Pour tout nous pouvons former le vecteur de comptage , qui compte le nombre de apparitions de chaque résultat dans les premières valeurs de la séquence. Puisque la séquence sous-jacente est échangeable, le vecteur de comptage est distribué comme suit:n ∈ N1,2,...,m n∈N nX≡X(n)≡(X1,X2,...,Xm) n
Supposons maintenant que nous ayons un vecteur de poids non négatifs et que nous utilisons ces poids pour définir la fonction linéaire:w=(w1,w2,...,wm)
Puisque les poids ne sont pas négatifs, cette nouvelle quantité n'est pas décroissante en . Nous définissons ensuite le nombre , qui est le plus petit nombre d'observations nécessaires pour obtenir une valeur minimale spécifiée pour notre fonction linéaire. Nous voulons approximer la distribution de dans le cas où cette valeur est (stochastiquement) grande.N ( a ) ≡ min { n ∈ N | A ( n ) ⩾ a } N ( a )n N(a)≡min{n∈N|A(n)⩾a} N(a)
Résoudre le problème général d'approximation: Premièrement, nous notons que puisque n'est pas décroissant dans (qui tient parce que nous avons supposé que tous les poids sont non négatifs), nous avons:nA(n) n
Par conséquent, la distribution de est directement lié à la distribution de . En supposant que la première quantité est grande, nous pouvons approximer la distribution de cette dernière en remplaçant le vecteur aléatoire discret par une approximation continue de la distribution normale multivariée. Cela conduit à une approximation normale pour la quantité linéaire , et nous pouvons calculer directement les moments de cette quantité. Pour ce faire, nous utilisons le fait que , et pour . Avec une algèbre de base, cela nous donne:A X A ( n ) E ( X i ) = n θ i V ( X i ) = n θ i ( 1 - θ i ) C ( X i , X j ) = - n θ i θ j i ≠ jN A X A(n) E(Xi)=nθi V(Xi)=nθi(1−θi) C(Xi,Xj)=−nθiθj i≠j
Prendre l'approximation normale du multinomial nous donne maintenant la distribution approximative . L'application de cette approximation donne:A(n) ~ N(nμ,nμ(1−μ))
(Le symbole est la notation standard pour la fonction de distribution normale standard.) Il est possible d'appliquer cette approximation pour trouver des probabilités relatives à la quantité pour une valeur spécifiée de . Il s'agit d'une approximation de base qui n'a pas tenté d'incorporer une correction de continuité sur les valeurs des valeurs de comptage multinomiales sous-jacentes. Il est obtenu en prenant une approximation normale en utilisant les mêmes deux premiers moments centraux que la fonction linéaire exacte.N ( a ) aΦ N(a) a
Application à votre problème: dans votre problème, vous avez des probabilités , poids , et valeur de coupure . Vous avez donc (arrondi à six décimales) . En appliquant l'approximation ci-dessus, nous avons (arrondi à six décimales):w=(0,ln2,ln3)a=ln100000μ=1θ=(12,16,13) w=(0,ln2,ln3) a=ln100000 μ=16ln2+13ln3=0.481729
En appliquant la distribution multinomiale exacte, en additionnant toutes les combinaisons satisfaisant à l'exigence , on peut montrer que le résultat exact est . Par conséquent, nous pouvons voir que l'approximation est assez proche de la réponse exacte dans le cas présent.P ( N ( a ) ⩾ 25 ) = 0,483500P(A(24)<a) P(N(a)⩾25)=0.483500
J'espère que cette réponse vous donnera une réponse à votre question spécifique, tout en la plaçant dans un cadre plus général de résultats probabilistes qui s'appliquent aux fonctions linéaires des vecteurs aléatoires multinomiaux. La présente méthode devrait vous permettre d'obtenir des solutions approximatives aux problèmes du type général auquel vous êtes confronté, permettant une variation des nombres spécifiques dans votre exemple.
la source
Faisons une approximation normale.
Tout d'abord, reformulons complètement votre problème dans les journaux. Vous commencez à 0 au temps t = 0. Ensuite, à chaque pas de temps, vous ajoutez:
0 avec probabilité 1/2
Vous arrêtez ce processus lorsque votre somme dépasse moment auquel vous regardez le nombre de lancers que vous avez effectués. Le nombre de lancers qu'il vous a fallu pour atteindre ce point est ^Nlog(105) N
Ma calculatrice me dit que la moyenne de vos incréments est: et que la variance est . Pour référence, le point final est à , nous allons donc l'atteindre en environ 24 étapes≈ 0,25 ≈ 11,51≈0.48 ≈0.25 ≈11.51
À condition que nous ayons effectué 25 étapes, la distribution de la somme est à peu près une gaussienne centrée à 12,0 et avec une variance de 6,25. Cela nous donne une approximation gaussienne approximative dep(N≥25)≈0.5
Il faudrait regarder les cumulants de la somme à N = 25 pour savoir si l'approximation gaussienne est correcte ou non. Étant donné que les incréments ne sont pas symétriques, l'approximatif n'est peut-être pas le meilleur
la source