Je travaille sur des modèles de données de comptage gonflés à zéro en utilisant le pscl
package. Je me demande simplement pourquoi il n'y a pas de développement de modèles pour les modèles de données de comptage gonflés! Aussi pourquoi il n'y a pas de développement de modèles de données de comptage bimodaux, disons gonflés zéro et 2! Une fois, j'ai généré des données de Poisson gonflées et constaté que ni le modèle glm
avec family=poisson
ni le modèle binomial ( glm.nb
) négatif n'étaient assez bons pour bien ajuster les données. Si quelqu'un peut faire la lumière sur ma pensée, aussi excentrique soit-elle, cela me serait très utile.
8
Réponses:
Un modèle de Poisson un gonflé pour un compte estYi
où la moyenne de Poisson et la probabilité de Bernoulli sont liées aux prédicteurs par le biais de fonctions de liaison appropriées. Vous pouvez définir un modèle similaire pour gonfler les probabilités pour toutes les valeurs que vous choisissez.μi πi
Pourtant, zéro a une place spéciale (et autrefois controversée) parmi les nombres de comptage - dans un sens représentant l'absence de quoi que ce soit à compter. Et c'est la distinction «rien» vs «quelque chose», plutôt que la distinction «un» vs «tout autre compte» qui a tendance à être pertinente pour un large éventail de phénomènes que nous aimons modéliser: il y a un processus qui ne donne rien, un , deux, ... compte et un autre qui ne donne aucun compte.
la source
score function
ethessian matrix
. Pouvez-vous me recommander un texte / article qui pourrait m'aider à en savoir plus?zeroinfl
code devraient le faire - changer la probabilité et le score de Poisson gonflés à zéro pour correspondre au modèle ci-dessus (ou essayez simplement de changer la probabilité et de ne pas passer le score àoptim
). Bien sûr, vous pouvez également demander ici ou sur SO, le cas échéant, des références ou de l'aide pour les choses sur lesquelles vous êtes coincé.Le package R
VGAM
a une fonctionvglm
qui peut être utilisée pour s'adapter à toutes sortes de modèles Poisson-esque. Vous pouvez l'utiliser pour spécifier un modèle gonflé, donc quelque chose commevglm(Y~X,family=oipospoisson(),data=data)
. Voir ici pour plus de détails.la source