Supposons que sont indépendants etY=(Y1,…,Yn)′
Ouije= 0Ouije= kavec probabilité p je+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!
Supposons également que les paramètres λ=(λ1,…,λn)′ et p=(p1,…,pn) satisfassent
log(λ)logit(p)=Bβ=log(p/(1−p))=Gλ.
Si les mêmes covariables affectent et p de sorte que B = G , alors pourquoi la régression de Poisson gonflée par zéro nécessite-t-elle deux fois plus de paramètres que la régression de Poisson?λpB=G
Réponses:
Dans le cas de Poisson-gonflé à zéro, si , alors β et λ ont tous deux la même longueur, qui est le nombre de colonnes de B ou G . Ainsi, le nombre de paramètres est le double du nombre de colonnes de la matrice de conception, c'est-à-dire le double du nombre de variables explicatives, y compris l'ordonnée à l'origine (et quel que soit le codage factice nécessaire).B = G β λ B g
Dans une régression de Poisson droite, il n'y a pas de vecteur à se soucier, pas besoin d'estimer λ . Ainsi, le nombre de paramètres est juste la longueur de β, c'est-à-dire la moitié du nombre de paramètres dans le cas de gonflement nul.p λ β
Maintenant, il n'y a pas de raison particulière pour que soit égal à G , mais généralement cela a du sens. Cependant, on pourrait imaginer un processus de génération de données où la chance d'avoir des événements du tout est créée par un processus G λ et un processus complètement différent B β détermine le nombre d'événements, compte tenu des événements non nuls. À titre d'exemple artificiel, je choisis des salles de classe en fonction de leurs résultats aux examens d'histoire pour jouer à un jeu sans rapport, puis j'observe le nombre de buts qu'ils marquent. Dans ce cas, B peut être très différent de G (si les choses qui conduisent aux résultats de l'examen de l'historique sont différentes de celles qui conduisent aux performances dans le jeu) et β et λB g G λ B β B g β λ pourrait avoir des longueurs différentes. peut avoir plus de colonnes que B ou moins. Ainsi, le modèle de Poisson gonflé à zéro dans ce cas aura plus de paramètres qu'un simple modèle de Poisson.g B
Dans la pratique courante, je pense que plupart du temps.G = B
la source