Distribution qui décrit la différence entre les variables distribuées binomiales négatives?

18

Une distribution de Skellam décrit la différence entre deux variables qui ont des distributions de Poisson. Existe-t-il une distribution similaire qui décrit la différence entre les variables qui suivent des distributions binomiales négatives?

Mes données sont produites par un processus de Poisson, mais incluent une bonne quantité de bruit, conduisant à une surdispersion dans la distribution. Ainsi, la modélisation des données avec une distribution binomiale négative (NB) fonctionne bien. Si je veux modéliser la différence entre deux de ces ensembles de données NB, quelles sont mes options? Si cela peut aider, supposez des moyennes et une variance similaires pour les deux ensembles.

chrisamiller
la source
Il existe de nombreuses distributions faciles à décrire qui n'ont pas de noms standard.
Glen_b -Reinstate Monica

Réponses:

22

Je ne connais pas le nom de cette distribution mais vous pouvez simplement le dériver de la loi de la probabilité totale. Supposons que ont chacun des distributions binomiales négatives avec les paramètres ( r 1 , p 1 ) et ( r 2 , p 2 ) , respectivement. J'utilise le paramétrage où X , Y représentent le nombre de succès avant les échecs r 1 'e et r 2 ' e, respectivement. Alors,X,Y(r1,p1)(r2,p2)X,Yr1r2

P(X-Oui=k)=EOui(P(X-Oui=k))=EOui(P(X=k+Oui))=y=0P(Oui=y)P(X=k+y)

Nous savons

P(X=k+y)=(k+y+r1-1k+y)(1-p1)r1p1k+y

et

P(Y=y)=(y+r21y)(1p2)r2p2y

donc

P(XY=k)=y=0(y+r21y)(1p2)r2p2y(k+y+r11k+y)(1p1)r1p1k+y

Ce n'est pas joli (ouais!). La seule simplification que je vois tout de suite est

p1k(1p1)r1(1p2)r2y=0(p1p2)y(y+r21y)(k+y+r11k+y)

ce qui est encore assez moche. Je ne sais pas si cela est utile, mais cela peut également être réécrit comme

p1k(1p1)r1(1p2)r2(r11)!(r21)!y=0(p1p2)y(y+r21)!(k+y+r11)!y!(k+y)!

I'm not sure if there is a simplified expression for this sum but it could be approximated numerically if you only need it to calculate p-values

I verified with simulation that the above calculation is correct. Here is a crude R function to calculate this mass function and carry out a few simulations

  f = function(k,r1,r2,p1,p2,UB)  
  {

  S=0
  const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
  const = const/( factorial(r1-1) * factorial(r2-1) ) 

  for(y in 0:UB)
  {
     iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
     iy = iy/( factorial(y)*factorial(y+k) )
     S = S + iy
  }

  return(S*const)
  }

 ### Sims
 r1 = 6; r2 = 4; 
 p1 = .7; p2 = .53; 
 X = rnbinom(1e5,r1,p1)
 Y = rnbinom(1e5,r2,p2)
 mean( (X-Y) == 2 ) 
 [1] 0.08508
 f(2,r1,r2,1-p1,1-p2,20)
 [1] 0.08509068
 mean( (X-Y) == 1 ) 
 [1] 0.11581
 f(1,r1,r2,1-p1,1-p2,20)
 [1] 0.1162279
 mean( (X-Y) == 0 ) 
 [1] 0.13888
 f(0,r1,r2,1-p1,1-p2,20)
 [1] 0.1363209

I've found the sum converges very quickly for all of the values I tried, so setting UB higher than 10 or so is not necessary. Note that R's built in rnbinom function parameterizes the negative binomial in terms of the number of failures before the r'th success, in which case you'd need to replace all of the p1,p2's in the above formulas with 1p1,1p2 pour la compatibilité.

Macro
la source
Merci. J'aurai besoin de temps pour digérer cela, mais votre aide est très appréciée.
chrisamiller
-2

Oui. La distribution discrète généralisée asymétrique de Laplace est la différence entre deux variables aléatoires binomiales distribuées négatives. Pour plus de précisions, reportez-vous à l'article disponible en ligne «Distribution Laplace discrète généralisée asymétrique» de seetha Lekshmi.V. et simi sebastian

simi sebastian
la source
4
Pouvez-vous fournir une citation complète et un résumé des informations contenues dans le document afin que les futurs lecteurs puissent décider si c'est quelque chose qu'ils souhaitent poursuivre?
gung - Rétablir Monica
L'article mentionné par @ simi-sebastian (l'auteur?) Est ijmsi.org/Papers/Volume.2.Issue.3/K0230950102.pdf . Cependant, à moins que je ne me trompe, cela ne concerne que le cas des variables binomiales négativesX et Ouiles deux ayant le même paramètre de dispersion, plutôt que le cas plus général décrit par l'affiche originale.
Constantinos