Poisson est exponentiel comme Gamma-Poisson est quoi?

16

Une distribution de Poisson peut mesurer des événements par unité de temps et le paramètre est . La distribution exponentielle mesure le temps jusqu'au prochain événement, avec le paramètre . On peut convertir une distribution dans l'autre, selon qu'il est plus facile de modéliser des événements ou des heures.λ1λ

Maintenant, un gamma-poisson est un poisson "étiré" avec une plus grande variance. Une distribution de Weibull est une exponentielle "étirée" avec une plus grande variance. Mais ces deux peuvent-ils être facilement convertis l'un dans l'autre, de la même manière que Poisson peut être converti en exponentiel?

Ou existe-t-il une autre distribution plus appropriée à utiliser en combinaison avec la distribution gamma-poisson?

Le gamma-poisson est également connu sous le nom de distribution binomiale négative, ou NBD.

zbicycliste
la source

Réponses:

14

Il s'agit d'un problème assez simple. Bien qu'il existe un lien entre la distribution de Poisson et les distributions binomiales négatives, je pense en fait que cela ne sert à rien pour votre question spécifique car cela encourage les gens à penser aux processus binomiaux négatifs. Fondamentalement, vous avez une série de processus de Poisson:

Yi(ti)|λiPoisson(λiti)

Où est le processus et est le moment où vous l'observez, et i désigne les individus. Et vous dites que ces processus sont "similaires" en liant les taux ensemble par une distribution:Yitii

λiGamma(α,β)

En faisant l'intégration / mxixing sur λi , vous avez:

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Cela a un pmf de:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Pour obtenir la répartition du temps d'attente, nous notons que:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Différenciez-le et vous avez le PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Il s'agit d'un membre des distributions généralisées de Pareto, type II. Je l'utiliserais comme distribution de votre temps d'attente.

Pour voir la connexion avec la distribution de Poisson, notez que , de sorte que si nous définissons puis prenez la limite nous obtenons:β=ααβ=E(λi|αβ) αβ=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Cela signifie que vous pouvez interpréter comme un paramètre de sur-dispersion.1α

probabilitéislogique
la source
1
Vous pouvez également noter que la distribution du temps d'attente est, en gros, une distribution exponentielle avec un paramètre de fréquence aléatoire Gamma et à proprement parler, c'est une distribution Bêta du deuxième type, comme pour toute distribution Gamma avec un paramètre de fréquence aléatoire Gamma.
Stéphane Laurent
En utilisant @probabilityislogic comme base, j'ai trouvé l'article suivant fournissant plus de détails sur la relation entre NBD et Pareto: Gupta, Sunil et Donald G. Morrison. Estimation de l'hétérogénéité des taux d'achat des consommateurs. Marketing Science, 1991, 10 (3), 264-269. Merci à tous ceux qui m'ont aidé à répondre à cette question.
zbicyclist
+1, je suppose que cette belle forme analytique peut ne plus exister pour , où est une constante. Poisson(λiti+c)c
Randel
1
@randel - vous pourriez obtenir une forme "sympa" en notant que ce rv est la somme de deux rv indépendants ... où est le même que ci-dessus et . Comme ne dépend pas de ou le pdf de est la convolution du pdf binomial négatif ci-dessus et d'un poisson pdf. Pour obtenir la distribution du temps d'attente, multipliez simplement dans la réponse ci-dessus par . Vous obtenez alors le temps d'attente cdf de et pdf deZi=Yi+XiYiXipoisson(c)XiλiYiZiPr(Yi=0)Pr(Xi=0)=ec1ec(1+tiβ)αecαβ(1+tiβ)(α+1).
probabilités
1
Cela ne fonctionnera pas en termes de distribution de mixage, car vous avez besoin de (sinon la moyenne du poisson est négative). La distribution de mélange gamma devrait être tronquée (j'ai également supposé que dans ma réponse précédente). Cela signifierait aucune distribution nb. λi<cti1c>0
probabilitéislogic
4

Une possibilité: Poisson est à exponentiel comme négatif-binomial est à ... exponentiel!

Il y a un processus de Lévy croissant pur et simple appelé processus binomial négatif de telle sorte qu'au temps la valeur a une distribution binomiale négative. Contrairement au processus de Poisson, les sauts ne sont pas presque sûrement . Au lieu de cela, ils suivent une distribution logarithmique . Selon la loi de la variance totale , une partie de la variance vient du nombre de sauts (mis à l'échelle par la taille moyenne des sauts), et une partie de la variance vient des tailles des sauts, et vous pouvez l'utiliser pour vérifier qu'elle est trop dispersé.t1

Il peut y avoir d'autres descriptions utiles. Voir «Cadrer la distribution binomiale négative pour le séquençage de l'ADN».


Permettez-moi d'être plus explicite sur la façon dont le processus binomial négatif décrit ci-dessus peut être construit.

  • Choisissez .p<1

  • Soit IID avec des distributions logarithmiques, doncX1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Soit un processus de Poisson à vitesse constante , doncNlog(1p)N(t)=Pois(tlog(1p)).

  • Soit le processus pour queNBP

NBP(t)=i=1N(t)Xi.

NBP est un processus de saut pur avec des sauts distribués logarithmiquement. Les écarts entre les sauts suivent une distribution exponentielle avec le tauxlog(1p).

Je ne pense pas qu'il soit évident à partir de cette description que a une distribution binomiale négative , mais il y a une courte preuve utilisant des fonctions génératrices de probabilités sur Wikipedia , et Fisher l'a également prouvé quand il a introduit le distribution logarithmique pour analyser les fréquences relatives des espèces.NBP(t)NB(t,p)

Douglas Zare
la source
1
Non, tout processus de Poisson composé a un temps d'attente exponentiel. Cela signifie que vous ajoutez des variables aléatoires IID avec une certaine distribution. Pois(λt)
Douglas Zare
NN
2
0

Je ne suis pas encore en mesure de commenter, je m'excuse donc, ce n'est pas une solution définitive.

Vous demandez la distribution appropriée à utiliser avec un NB mais appropriée n'est pas entièrement définie. Si une distribution appropriée signifie appropriée pour expliquer les données et que vous commencez avec un Poisson surdispersé, vous devrez peut-être approfondir la cause de la surdispersion. Le NB ne fait pas de distinction entre un Poisson avec des moyennes hétérogènes ou une dépendance d'occurrence positive (qu'un événement se produise augmente la probabilité qu'un autre se produise). En temps continu, il y a aussi une dépendance à la durée, par exemple une dépendance à la durée positive signifie que le passage du temps augmente la probabilité d'une occurrence. Il a également été démontré que la dépendance négative à la durée provoque asymptotiquement un Poisson surdispersé [1] . Cela s'ajoute à la liste de ce qui pourrait être le modèle de temps d'attente approprié.

Meadowlark Bradsher
la source
1
cause de la surdispersion: il s'agit des données d'achat des consommateurs. Les consommateurs individuels sont des poissons, chacun avec un taux d'achat lambda. Mais tous les consommateurs n'ont pas le même lambda - c'est la cause de la surdispersion. Les taux d'achat de lambda sont considérés comme étant distribués sous forme gamma. Il s'agit d'un modèle courant (remonte à ASC Ehrenberg), mais je n'ai rien trouvé dans son écriture qui réponde à cette question.
zbicyclist