Quelle est l'approximation normale de la distribution multinomiale?

Réponses:

21

Vous pouvez l'approcher avec la distribution normale multivariée de la même manière que la distribution binomiale est approximée par la distribution normale univariée. Consultez les éléments de la théorie de la distribution et de la distribution multinomiale pages 15-16-17.

Soit le vecteur de vos probabilités. Alors le vecteur moyen de la distribution normale multivariée est . La matrice de covariance est une matrice symétrique . Les éléments diagonaux sont en fait la variance des ; c'est-à-dire , . L'élément hors diagonale dans la ième ligne et la jième colonne est , où n'est pas égal à .P=(p1,...,pk)np=(np1,np2,...,npk)k×kXinpi(1pi)i=1,2...,kCov(Xi,Xj)=npipjij

Stat
la source
1
Consultez la 2e référence.
Stat
3
Stat, pour que cette réponse puisse se suffire à elle-même (et être résistante à la pourriture des liens), pourriez-vous donner un résumé de la solution?
whuber
4
Faut-il une correction de continuité? Comment l'appliqueriez-vous?
Jack Aidley
2
La matrice de covariance n'est pas définie positive, mais plutôt semi-définie positive, et n'est pas de rang complet. Cela rend la distribution multinormale résultante indéfinie. C'est le problème que j'ai rencontré. Une idée de comment le gérer?
Mohammad Alaggan
2
@ M.Alaggan: Les matrices moyenne / covariance définies ici ont un problème mineur: pour une distribution multinomiale avec variables, la normale multivariée équivalente a variées. Cela est évident dans l'exemple binomial simple, qui est approximatif par la distribution normale (ordinaire). Pour plus de détails, voir l'exemple 12.7 des éléments de la théorie de la distribution . kk1
MS Dousti
1

La densité donnée dans cette réponse est dégénérée, et j'ai donc utilisé ce qui suit pour calculer la densité qui résulte de l'approximation normale:

Il y a un théorème qui dit étant donné une variable aléatoire , pour un vecteur à dimensions avec et , cela;X=[X1,,Xm]TMultinom(n,p)mpipi=1iXi=n

Xdndiag(u)Q[Z1Zm10]+[np1npm],

pour grand , donné;n

  • un vecteur avec ;uui=pi
  • variables aléatoires pour et;ZiN(0,1)i=1,,m1
  • une matrice orthogonale avec la dernière colonne .Qu

Autrement dit, avec un certain réarrangement, nous pouvons établir une distribution normale multivariée dimensionnelle pour les premiers composants de (qui sont les seuls composants intéressants parce que est la somme des autres).m1m1XXm

Une valeur appropriée de la matrice est avec - c'est-à-dire une transformation particulière du Householder.QI2vvTvi=(δimui)/2(1um)

Si nous limitons le côté gauche aux premières lignes et restreignons à ses premières lignes et colonnes (notons respectivement et ) alors:m1Qm1m1X^Q^

X^dndiag(u^)Q^[Z1Zm1]+[np1npm1]N(μ,nΣ),

pour grand , où;n

  • u^ désigne les premiers termes de ;m1u
  • la moyenne est , et;μ=[np1,,npm1]T
  • la matrice de covariance avec .nΣ=nAATA=diag(u^)Q^

Le côté droit de cette équation finale est la densité non dégénérée utilisée dans le calcul.

Comme prévu, lorsque vous branchez tout, vous obtenez la matrice de covariance suivante:

(nΣ)ij=npipj(δijpipj)

pour , qui est exactement la matrice de covariance dans la réponse originale limitée à ses premières lignes et colonnes.i,j=1,,m1m1m1

Cette entrée de blog était mon point de départ.

stéphématicien
la source
1
Une autre ressource utile est les liens fournis dans: stats.stackexchange.com/questions/2397/…
stephematician
1
Bonne réponse (+1) --- Notez que vous pouvez intégrer des liens avec la syntaxe [textual description](hyperlink). J'ai pris la liberté de modifier cette réponse pour intégrer vos liens.
Ben - Réintègre Monica