Régression de Poisson gonflée zéro

Supposons que sont indépendants et $\textbf{Y} = (Y_1, \dots, Y_n)'$

\begin{aligned} Y_{i} = 0 & with probability p_{i} + (1 - p_{i}) e^{- λ_{i}} \\ Y_{i} = k & with probability (1 - p_{i}) e^{- λ_{i}} λ_{i}^{k} / k! \end{aligned}

$\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! }$

Supposons également que les paramètres $\mathbf{\lambda} = (\lambda_1, \dots, \lambda_n)'$ et $\textbf{p} = (p_1, \dots, p_n)$ satisfassent

\begin{aligned} \log (λ) & = B β \\ logit (p) & = \log (p / (1 - p)) = G λ . \end{aligned}

$\eqalign{ \log(\mathbf{\lambda}) &= \textbf{B} \beta \\ \text{logit}(\textbf{p}) &= \log(\textbf{p}/(1-\textbf{p})) = \textbf{G} \mathbf{\lambda}. }$

Si les mêmes covariables affectent et sorte que , alors pourquoi la régression de Poisson gonflée par zéro nécessite-t-elle deux fois plus de paramètres que la régression de Poisson? $\mathbf{\lambda}$ $\textbf{p}$ $\textbf{B} = \textbf{G}$

poisson-regression zero-inflation Damien
la source

Il faut encore estimer

sont des matrices de conception (données), donc celles qui sont égales ne réduisent pas la dimension de l'espace des paramètres.

β

$\beta$

λ

$\lambda$

B

$\bf B$

G

$\bf G$

Macro

@Macro: Si

est une colonne d' unités , alors pourquoi aurions-nous besoin d'un paramètre de plus pour estimer que la régression de poisson?

G

$\textbf{G}$

Damien

eh bien il faudrait estimer

(l '"interception" dans la partie logistique du modèle) et

(l' "interception" dans la partie poisson du modèle) donc il y a 2 paramètres au lieu de 1.

p_{i}

$p_i$

λ_{i}

$\lambda_i$

Macro

@Robby, pour réduire le nombre de paramètres, vous devrez faire quelques contraintes. Par exemple,

, bien qu'il n'y ait aucune raison de penser que cela a du sens - d'autant plus que les fonctions de liaison sont différentes.

λ = β

$\lambda=\beta$

Macro

@MichaelChernick - cela s'appelle Poisson gonflé à zéro parce que vous "gonflez" essentiellement la probabilité de voir un zéro à partir d'un poisson dist'n tout en conservant les mêmes probabilités relatives de voir une valeur non nulle que le Poisson.

jbowman

Réponses:

Dans le cas de Poisson-gonflé à zéro, si , alors et ont tous deux la même longueur, qui est le nombre de colonnes de ou . Ainsi, le nombre de paramètres est le double du nombre de colonnes de la matrice de conception, c'est-à-dire le double du nombre de variables explicatives, y compris l'ordonnée à l'origine (et quel que soit le codage factice nécessaire). $\mathbf{B}=\mathbf{G}$ $\beta$ $\lambda$ $\mathbf{B}$ $\mathbf{G}$

Dans une régression de Poisson droite, il n'y a pas de vecteur à se soucier, pas besoin d'estimer . Ainsi, le nombre de paramètres est juste la longueur de c'est-à-dire la moitié du nombre de paramètres dans le cas de gonflement nul. $\mathbf{p}$ $\lambda$ $\beta$

Maintenant, il n'y a pas de raison particulière pour que soit égal à , mais généralement cela a du sens. Cependant, on pourrait imaginer un processus de génération de données où la chance d'avoir des événements du tout est créée par un processus et un processus complètement différent détermine le nombre d'événements, compte tenu des événements non nuls. À titre d'exemple artificiel, je choisis des salles de classe en fonction de leurs résultats aux examens d'histoire pour jouer à un jeu sans rapport, puis j'observe le nombre de buts qu'ils marquent. Dans ce cas, peut être très différent de (si les choses qui conduisent aux résultats de l'examen de l'historique sont différentes de celles qui conduisent aux performances dans le jeu) et et $\mathbf{B}$ $\mathbf{G}$ $\mathbf{G\lambda}$ $\mathbf{B\beta}$ $\mathbf{B}$ $\mathbf{G}$ $\beta$ $\lambda$ pourrait avoir des longueurs différentes. peut avoir plus de colonnes que ou moins. Ainsi, le modèle de Poisson gonflé à zéro dans ce cas aura plus de paramètres qu'un simple modèle de Poisson. $\mathbf{G}$ $\mathbf{B}$

Dans la pratique courante, je pense que plupart du temps. $\mathbf{G} = \mathbf{B}$

Peter Ellis
la source