Quelle est la distribution de probabilité de cette somme aléatoire de variables de Bernoulli non iid?

9

J'essaie de trouver la distribution de probabilité d'une somme d'un nombre aléatoire de variables qui ne sont pas distribuées de manière identique. Voici un exemple:

John travaille dans un centre d'appels du service client. Il reçoit des appels avec des problèmes et essaie de les résoudre. Ceux qu'il ne peut pas résoudre, il les transmet à son supérieur. Supposons que le nombre d'appels qu'il reçoit en une journée suit une distribution de Poisson avec une moyenne . La difficulté de chaque problème varie de trucs assez simples (qu'il peut certainement gérer) à des questions très spécialisées qu'il ne saura pas résoudre. Supposons que la probabilité qu'il sera en mesure de résoudre le i- ème problème suit une distribution bêta avec les paramètres et et est indépendante des problèmes précédents. Quelle est la répartition du nombre d'appels qu'il résout en une journée?p iμpiβαβ

Plus formellement, j'ai:

Y=I(N>0)i=0NXi pouri=0,1,2,...,N

où , et( X i | p i ) ~ B e r n o u l l i ( p i ) p i ~ B e t un ( α , β )NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Notez que, pour l'instant, je suis heureux de supposer que les sont indépendants. J'accepterais également que les paramètres et ne pas mutuellement bien que dans un exemple réel de ceci lorsque est grand, les paramètres et sont tels que la distribution Beta a plus de masse sur les faibles taux de réussite . Mais ignorons cela pour l'instant. μ , α β μ α β pXiμ,αβμαβp

Je peux calculer mais c'est à peu près tout. Je peux également simuler des valeurs pour avoir une idée de ce à quoi ressemble la distribution de (cela ressemble à Poisson mais je ne sais pas si cela dépend du nombre de et j'ai essayé ou s'il généralise, et comment il pourrait changer pour différentes valeurs de paramètres). Une idée de ce qu'est cette distribution ou comment je pourrais la dériver?Y μ , α βP(Y=0)Yμ,αβ

Veuillez noter que j'ai également posté cette question sur le forum TalkStats, mais j'ai pensé qu'elle pourrait attirer davantage l'attention ici. Toutes mes excuses pour la publication croisée et merci d'avance pour votre temps.

EDIT : Comme il s'avère (voir les réponses très utiles ci-dessous - et merci pour celles-ci!), Il s'agit en effet d'une , quelque chose ce que je devinais sur la base de mon intuition et de quelques simulations, mais je n'ai pas pu le prouver. Ce que je trouve maintenant surprenant cependant, c'est que la distribution de Poisson ne dépend que de la moyenne de la distribution mais n'est pas affectée par sa variance.BetaPoisson(μαα+β)Beta

Par exemple, les deux distributions bêta suivantes ont la même variance moyenne mais différente. Pour plus de clarté, le pdf bleu représente un et le rouge .B e t a ( 0,75 , 0,75 )Beta(2,2)Beta(0.75,0.75)

Distributions bêta

Cependant, ils aboutiraient tous deux à la même qui, à mon avis, semble légèrement contre-intuitive. (Ne pas dire que le résultat est faux, juste surprenant!)Poisson(0.5μ)

Constantinos
la source
Pour fixe, il existe une distribution binomiale de Poisson, mais votre problème est plus compliqué que cela. N
Tim
Merci, je connais la distribution de Poisson-binôme, mais est aléatoire ici. N
Constantinos
Vous pourriez jeter un coup d'œil au Poisson composé , mais vous devrez peut-être travailler avec les 0 pour le rendre utile
Glen_b -Reinstate Monica

Réponses:

6

Les appels (c'est-à-dire le ) arrivent selon un processus de Poisson. Le nombre total d'appels suit une distribution de Poisson. Divisez les appels en deux types, par exemple si ou . Le but est de déterminer le processus qui génère les s. Ceci est trivial si avec une probabilité fixe : par le principe de superposition des processus de Poisson, le processus complet aminci aux seuls s serait également un processus de Poisson, avec un taux . En fait c'est le cas, nous avons juste besoin d'une étape supplémentaire pour y arriver. N X i = 1 X i = 0 1 X i = 1 p 1 p μXiNXi=1Xi=01Xi=1p1pμ

Marginaliser sur , de sorte que P r ( X i | α , β ) = 1 0 p X i i ( 1 - p i ) 1 - X i p α - 1 i ( 1 - p i ) β - 1pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

Où est la fonction bêta. En utilisant le fait que , ce qui précède se simplifie en; Γ(x+1)=xΓ(x)B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
En d'autres termes, . Par la propriété de superposition, est Poisson distribué avec le taux .YαμXiBernoulli(αα+β)Yαμα+β

Un exemple numérique (avec R) ... sur la figure, les lignes verticales sont issues de la simulation et les points rouges sont les pmf dérivés ci-dessus:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

entrez la description de l'image ici

Nate Pope
la source
3
  1. Puisque est une variable aléatoire avec un vous avez et c'est en fait la probabilité que John résout réellement le ème problème, indépendamment de tous les autres. Bêta ( α , β ) E [ p i ] = αpiBeta(α,β) iE[pi]=αα+βi

  2. Comme le nombre total de problèmes dans une journée a une distribution de Poisson avec le paramètre et chacun sera résolu avec la probabilité , le nombre que John résout chaque jour a une distribution de Poisson avec le paramètreαμ μααα+βμαα+β

  3. Votre calcul de la probabilité qu'il ne résout aucun problème devrait êtreP(Y=0)=eμα/(α+β)

Henri
la source