conditionnellement au total, quelle est la distribution des binômes négatifs

9

Si sont des binômes négatifs iid, alors quelle est la distribution de donnéex1,x2,,xn(x1,x2,,xn)

x1+x2++xn=N ?

N est fixe.

Si sont Poisson alors, conditionnellement au total, est multinomial. Je ne sais pas si c'est vrai pour un binôme négatif, car c'est un mélange de Poisson.x1,x2,,xn(x1,x2,,xn)

Au cas où vous voudriez savoir, ce n'est pas un problème de devoirs.

qkhhly
la source
2
Étant donné le lien entre les distributions Gamma et le Dirichlet, ma première supposition serait que - au moins compte tenu des restrictions appropriées sur les binômes négatifs - il pourrait s'avérer dans certains cas être Dirichlet-multinomial.
Glen_b -Reinstate Monica
Googler autour des termes de votre article et mon commentaire produit quelques hits qui suggèrent que cela pourrait être une ligne fructueuse à poursuivre.
Glen_b -Reinstate Monica

Réponses:

7

Désolé pour la réponse tardive, mais cela m'a aussi dérangé et j'ai trouvé la réponse. La distribution est en effet Dirichlet-Multinomial et le neg individuel. les distributions binomiales n'ont même pas besoin d'être identiques, tant que leur facteur Fano (rapport de variance à la moyenne) est identique.

Longue réponse:

Si vous paramétrez NB comme:

p(X=x|λ,θ)=NB(x|λ,θ)=(θ1λ+x1x)(11+θ1)x(θ11+θ1)θ1λ

Alors et etE(X)=λVar(X)=λ(1+θ)

i:XiNB(λi,θ) implique

XiNB(λi,θ)

Puis en prenant la probabilité compte tenu de la somme:

NB(xi|λi,θ)NB(xi|λi,θ)=(11+θ1)xi(θ11+θ1)θ1λi(θ1λi+xi1xi)(11+θ1)xi(θ11+θ1)θ1λi(θ1λi+xi1xi)==Γ(xi+1)Γ(θ1λi)Γ(θ1λi+xi)Γ(θ1λi+xi)Γ(xi+1)Γ(θ1λi)=DM(x1,...,xn|θ1λ1,...,θ1λn)

où est la vraisemblance Dirichlet-Multinomiale. Cela résulte simplement du fait que, à l'exception des coefficients multinomiaux, de nombreux termes de la fraction sur le côté gauche s'annulent, vous laissant uniquement avec les termes de la fonction gamma qui se trouvent être les mêmes que dans la probabilité DM.DM

Notez également que les paramètres de ce modèle ne sont pas identifiables car une augmentation de avec une diminution simultanée de tous les résultats de exactement la même probabilité.θλi

La meilleure référence que j'ai pour cela est les sections 2 à 3.1 de Guimarães & Lindrooth (2007): Contrôle de la surdispersion dans les modèles logit conditionnels groupés: Une application simple de calcul de la régression multiromiale Dirichlet - elle est malheureusement payée, mais je n'ai pas pu trouver une référence non paywalled.

Martin Modrák
la source