Somme des variables aléatoires binomiales et de Poisson

10

Si nous avons deux variables aléatoires indépendantes et , quelle est la fonction de masse de probabilité de ?X1Binom(n,p)X2Pois(λ)X1+X2

NB Ce n'est pas des devoirs pour moi.

Matteo Fasiolo
la source
Je suppose que vous avez essayé de convoluer? en.wikipedia.org/wiki/… Où êtes-vous resté coincé? Je suppose qu'il n'y a pas de formulaire fermé, sinon la solution serait probablement ici: en.wikipedia.org/wiki/…
Stephan Kolassa
3
Oui, c'est ce que j'ai essayé, mais j'ai peut-être trouvé une réponse ici: mathstatica.com/SumBinomialPoisson Kummer fonction hypergéométrique confluente..heu!
Matteo Fasiolo
1
J'ai réécrit la balise de devoirs en fonction de son utilisation sur ce site . À votre santé. :-)
Cardinal
2
Roman signifie nouveau (non connu ou publié auparavant). Je ne suis pas d'accord non plus que l'utilisation de méthodes connues pour résoudre de nouveaux problèmes en fasse des devoirs - il en va de même pour la majorité des articles de revues publiant des résultats sur les distributions.
wolfies
2
Comme dans de nombreux autres cas dans les statistiques où une fonction hypergéométrique apparaît avec des arguments intégraux, vous pouvez comprendre qu'il s'agit d'une notation abrégée pour la somme implicite (finie) dans la convolution si vous le souhaitez. L'avantage d'une telle expression est qu'il existe une multitude de façons de la manipuler sous des formes plus simples et qu'elle peut souvent être évaluée sans réellement effectuer la sommation.
whuber

Réponses:

7

Vous vous retrouverez avec deux formules différentes pour , une pour et une pour . La manière la plus simple de résoudre ce problème consiste à calculer le produit de et . Alors, est le coefficient de dans le produit. Aucune simplification des sommes n'est possible.0 k < n kpX1+X2(k)0k<nn i = 0 p X 1 ( i ) z k j = 0 p X 2 ( j ) z j p X 1 + X 2 ( k ) z kkni=0npX1(i)zkj=0pX2(j)zjpX1+X2(k)zk

Dilip Sarwate
la source
1

Donner la formule fermée en termes de fonctions hypergéométriques généralisées (GHF) évoquées dans d'autres réponses (le GHF dans ce cas n'est vraiment qu'un polynôme fini, donc c'est un raccourci pour la somme finie.) J'ai utilisé l'érable pour additionner la convolution, avec ce résultat:

P(X1+X2=k)=x1=0min(n,k)(nx1)px1(1p)nx1eλλkx1(kx1)!=(1p)neλλkΓ(k+1)2F0(k,n; ;p(p1)λ)

kjetil b halvorsen
la source
0

Dilip Sarwate a déclaré il y a 7 ans qu'aucune simplification n'est possible, bien que cela ait été contesté dans les commentaires. Cependant, je pense qu'il est utile de noter que même sans aucune simplification, le calcul est assez simple dans n'importe quel tableur ou langage de programmation.

Voici une implémentation en R:

# example parameters
n <- 10
p <- .3
lambda <- 5

# probability for just a single value
x <- 10  # example value
sum(dbinom(0:x, n, p) * dpois(x:0, lambda))

# probability function for all values
x0  <- 0:30   # 0 to the maximum value of interest
x   <- outer(x0, x0, "+")
db  <- dbinom(x0, n, p)
dp  <- dpois(x0, lambda)
dbp <- outer(db, dp)
aggregate(as.vector(dbp), by=list(as.vector(x)), sum)[1:(max(x0)+1),]
Pere
la source
1
Dilip n'a pas montré qu'aucune simplification des sommes n'est possible: il a affirmé une telle affirmation (et l'assertion ne semble pas être correcte). Si vous suivez les liens fournis par l'OP, une solution est proposée en termes de fonctions hypergéométriques confluentes de Kummer.
wolfies
@wolfies - Ce serait un point très intéressant dans une nouvelle réponse à cette vieille question. Probablement plus intéressant que le mien.
Pere
1
Une approche potentiellement plus rapide pour les grands n dans le binôme et les grands lambda impliquerait des transformées de Fourier rapides (ou similaires). Je l'ai utilisé avec succès sur un certain nombre de problèmes du monde réel où la convolution n'est pas algébriquement pratique, mais les réponses numériques sont suffisantes et où de multiples variables indépendantes ont été ajoutées.
Glen_b -Reinstate Monica
1
Commentaire de Re @ Glen_b, pour des valeurs plus grandes de et cette convolution de force brute devient lourde. De plus, le défi n'est pas de l'implémenter, mais de trouver des points de terminaison appropriés pour calculer le tableau: fixer à 10 ne le coupera évidemment pas. Une méthode fiable consiste à définir des centiles extrêmes de la distribution, tels que , puis calculer pour la plage de , puis "hacher" les résultats (avec ) avant de procéder avec le produit externe. Lorsque est grand, appliquez une procédure similaire aux probabilités binomiales. λnλdpoisxxx<-qpois(0:1+c(1,-1)*1e-6, lambda)dpoisxzapsmalln
whuber
En effet. J'ai fait quelque chose de similaire avec ma propre application - sortir suffisamment loin a donné les quantiles requis aussi précisément que nécessaire.
Glen_b -Reinstate Monica