Il s'agit d'un problème assez simple. Bien qu'il existe un lien entre la distribution de Poisson et les distributions binomiales négatives, je pense en fait que cela ne sert à rien pour votre question spécifique car cela encourage les gens à penser aux processus binomiaux négatifs. Fondamentalement, vous avez une série de processus de Poisson:
Yi(ti)|λi∼Poisson(λiti)
Où est le processus et est le moment où vous l'observez, et i désigne les individus. Et vous dites que ces processus sont "similaires" en liant les taux ensemble par une distribution:Yitii
λi∼Gamma(α,β)
En faisant l'intégration / mxixing sur λi , vous avez:
Yi(ti)|αβ∼NegBin(α,pi)wherepi=titi+β
Cela a un pmf de:
Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!pyii(1−pi)α
Pour obtenir la répartition du temps d'attente, nous notons que:
= 1 - ( 1 - p i ) α = 1 - ( 1 +
Pr(Ti≤ti|αβ)=1−Pr(Ti>ti|αβ)=1−Pr(Yi(ti)=0|αβ)
=1−(1−pi)α=1−(1+tiβ)−α
Différenciez-le et vous avez le PDF:
pTi(ti|αβ)=αβ(1+tiβ)−(α+1)
Il s'agit d'un membre des distributions généralisées de Pareto, type II. Je l'utiliserais comme distribution de votre temps d'attente.
Pour voir la connexion avec la distribution de Poisson, notez que , de sorte que si nous définissons puis prenez la limite nous obtenons:β=ααβ=E(λi|αβ) α→∞β=αλα→∞
limα→∞αβ(1+tiβ)−(α+1)=limα→∞λ(1+λtiα)−(α+1)=λexp(−λti)
Cela signifie que vous pouvez interpréter comme un paramètre de sur-dispersion.1α
Une possibilité: Poisson est à exponentiel comme négatif-binomial est à ... exponentiel!
Il y a un processus de Lévy croissant pur et simple appelé processus binomial négatif de telle sorte qu'au temps la valeur a une distribution binomiale négative. Contrairement au processus de Poisson, les sauts ne sont pas presque sûrement . Au lieu de cela, ils suivent une distribution logarithmique . Selon la loi de la variance totale , une partie de la variance vient du nombre de sauts (mis à l'échelle par la taille moyenne des sauts), et une partie de la variance vient des tailles des sauts, et vous pouvez l'utiliser pour vérifier qu'elle est trop dispersé.t 1
Il peut y avoir d'autres descriptions utiles. Voir «Cadrer la distribution binomiale négative pour le séquençage de l'ADN».
Permettez-moi d'être plus explicite sur la façon dont le processus binomial négatif décrit ci-dessus peut être construit.
Choisissez .p<1
Soit IID avec des distributions logarithmiques, doncX1,X2,X3,... P(xi=k)=−1log(1−p)pkk.
Soit un processus de Poisson à vitesse constante , doncN −log(1−p) N(t)=Pois(−tlog(1−p)).
Soit le processus pour queNBP
Je ne pense pas qu'il soit évident à partir de cette description que a une distribution binomiale négative , mais il y a une courte preuve utilisant des fonctions génératrices de probabilités sur Wikipedia , et Fisher l'a également prouvé quand il a introduit le distribution logarithmique pour analyser les fréquences relatives des espèces.NBP(t) NB(t,p)
la source
Je ne suis pas encore en mesure de commenter, je m'excuse donc, ce n'est pas une solution définitive.
Vous demandez la distribution appropriée à utiliser avec un NB mais appropriée n'est pas entièrement définie. Si une distribution appropriée signifie appropriée pour expliquer les données et que vous commencez avec un Poisson surdispersé, vous devrez peut-être approfondir la cause de la surdispersion. Le NB ne fait pas de distinction entre un Poisson avec des moyennes hétérogènes ou une dépendance d'occurrence positive (qu'un événement se produise augmente la probabilité qu'un autre se produise). En temps continu, il y a aussi une dépendance à la durée, par exemple une dépendance à la durée positive signifie que le passage du temps augmente la probabilité d'une occurrence. Il a également été démontré que la dépendance négative à la durée provoque asymptotiquement un Poisson surdispersé [1] . Cela s'ajoute à la liste de ce qui pourrait être le modèle de temps d'attente approprié.
la source