Si j'ai des variables aléatoires qui sont des distributions de Poisson avec les paramètres , quelle est la distribution de (c'est-à-dire le plancher entier de la moyenne)?
Une somme de Poissons est également Poisson, mais je ne suis pas assez confiant dans les statistiques pour déterminer s'il en est de même pour le cas ci-dessus.
poisson-distribution
average
Lubo Antonov
la source
la source
Réponses:
Une généralisation de la question demande la distribution deY=⌊X/m⌋ lorsque la distribution de X est connue et appuyée sur les nombres naturels. (Dans la question, X a une distribution de Poisson du paramètre λ=λ1+λ2+⋯+λn et m=n .)
La distribution deY est facilement déterminé par la distribution de mY , dont la fonction de génération probabilité (PGF) peut être déterminée en fonction de la PGF de X . Voici un aperçu de la dérivation.
Écrivez pour le pgf de , où (par définition) . est construit à partir de de telle sorte que son pgf, , soitp(x)=p0+p1x+⋯+pnxn+⋯ X pn=Pr(X=n) mY X q
Parce que cela converge absolument pour , nous pouvons réorganiser les termes en une somme de morceaux du formulaire| x | ≤ 1
pour . La série de puissance des fonctions constituée de chaque terme de la série de commençant par le : on parle parfois de décimation de . Les recherches Google ne fournissent actuellement pas beaucoup d'informations utiles sur les décimations, donc pour être complet, voici une dérivation d'une formule.x t D m , t p m th p t tht=0,1,…,m−1 xtDm,tp mth p tth p
Soit n'importe quelle racine primitive de l'unité; par exemple, prenez . Il résulte alors de et quem th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ω mth ω=exp(2iπ/m) ωm=1 ∑m−1j=0ωj=0
Pour voir cela, notez que l'opérateur est linéaire, il suffit donc de vérifier la formule sur la base . Appliquer le côté droit à donne { 1 , x , x 2 , … , x n , … } x nxtDm,t {1,x,x2,…,xn,…} xn
Lorsque et diffèrent d'un multiple de , chaque terme de la somme est égal à et nous obtenons . Sinon, les termes parcourent les puissances de et ces sommes à zéro. D'où cet opérateur conserve toutes les puissances de congru à modulo et tue toutes les autres: c'est précisément la projection souhaitée.t n m 1 xn ωt−n x t m
Une formule pour suit facilement en changeant l'ordre de sommation et en reconnaissant l'une des sommes comme géométrique, l'écrivant ainsi sous forme fermée:q
Par exemple, le pgf d'une distribution de Poisson du paramètre est . Avec , et le pgf de seraλ p ( x ) = exp( λ ( x - 1 ) ) m = 2 ω = - 1 2 Y
Une utilisation de cette approche est de calculer les moments de et . La valeur de la dérivée du pgf évalué à est le moment factoriel . Le moment est une combinaison linéaire des premiers moments factoriels. En utilisant ces observations, nous trouvons, par exemple, que pour un Poisson distribué , sa moyenne (qui est le premier moment factoriel) est égale à , la moyenne de est égal à , et la moyenne de est égale àX mY kth x=1 kth kth k X λ 2⌊(X/2)⌋ λ−12+12e−2λ 3⌊(X/3)⌋ λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
Les moyennes pour sont affichées en bleu, rouge et jaune, respectivement, en fonction de : asymptotiquement, la moyenne diminue de par rapport à la moyenne de Poisson d'origine.m=1,2,3 λ (m−1)/2
Des formules similaires pour les variances peuvent être obtenues. (Ils deviennent désordonnés lorsque augmente et sont donc omis. Une chose qu'ils établissent définitivement est que lorsque aucun multiple de n'est Poisson: il n'a pas l'égalité caractéristique de moyenne et de variance) Voici un tracé des variances en fonction de pour :m m>1 Y λ m=1,2,3
Il est intéressant de noter que pour des valeurs plus élevées de les variances augmentent . Intuitivement, cela est dû à deux phénomènes concurrents: la fonction de plancher consiste en fait à regrouper des groupes de valeurs qui étaient à l'origine distinctes; cela doit entraîner une diminution de la variance . En même temps, comme nous l'avons vu, les moyens changent aussi (car chaque bac est représenté par sa plus petite valeur); cela doit entraîner l'ajout d'un terme égal au carré de la différence de moyennes. L'augmentation de la variance pour les grands devient plus grande avec des valeurs plus élevées de .λ λ m
Le comportement de la variance de avec est étonnamment complexe. Terminons par une simulation rapide (in ) montrant ce qu'elle peut faire. Les graphiques montrent la différence entre la variance de et la variance de pour Poisson distribué avec différentes valeurs de allant de à . Dans tous les cas, les parcelles semblent avoir atteint leurs valeurs asymptotiques à droite.mY m m⌊X/m⌋ X X λ 1 5000
R
la source
sapply()
pour la simulation. Merci.Comme le dit Michael Chernick, si les variables aléatoires individuelles sont indépendantes, la somme est Poisson avec le paramètre (moyenne et variance) que vous pourriez appeler .∑ni=1λi λ
La division par réduit la moyenne à et la variance sorte que la variance sera inférieure à la distribution de Poisson équivalente. Comme Michael le dit, toutes les valeurs ne seront pas des entiers.n λ/n λ/n2
L'utilisation de la fonction de plancher réduit légèrement la moyenne, d'environ , et affecte légèrement la variance mais de manière plus compliquée. Bien que vous ayez des valeurs entières, la variance sera toujours sensiblement inférieure à la moyenne et vous aurez donc une distribution plus étroite que le Poisson.12−12n
la source
La fonction de masse de probabilité de la moyenne de variables aléatoires de Poisson indépendantes peut être écrite explicitement, bien que la réponse ne vous aide pas beaucoup. Comme Michael Chernick l'a noté dans les commentaires sur sa propre réponse, la somme des variables aléatoires de Poisson indépendantes avec les paramètres respectifs est une variable aléatoire de Poisson avec le paramètre . Par conséquent, Ainsi, est une variable aléatoire prenant la valeur avec probabilité∑ i X i X i λ i λ = ∑ i λ i P { n ∑ i = 1 X i = k } = exp ( - λ ) λ kn ∑iXi Xi λi λ=∑iλi
la source
Y ne sera pas Poisson. Notez que les variables aléatoires de Poisson prennent des valeurs entières non négatives. Une fois que vous avez divisé par une constante, vous créez une variable aléatoire qui peut avoir des valeurs non entières. Il aura toujours la forme du Poisson. C'est juste que les probabilités discrètes peuvent se produire à des points non entiers.
la source