Pour analyser les dénombrements d'oiseaux gonflés à zéro, j'aimerais appliquer des modèles de comptage à gonflage nul en utilisant le package R pscl . Cependant, après avoir regardé l'exemple fourni dans la documentation pour l'une des principales fonctions ( ? Zeroinfl ), je commence à douter du véritable avantage de ces modèles. Selon l'exemple de code qui y est donné, j'ai calculé les modèles standard de poisson, quasi-poisson et bionomial négatif, les modèles simples de poisson et de binôme négatif gonflés à zéro et les modèles de poisson et de binôme négatif gonflés à zéro avec des régresseurs pour la composante zéro. J'ai ensuite inspecté les histogrammes des données observées et ajustées. (Voici le code pour répliquer cela.)
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
Je ne vois aucune différence fondamentale entre les différents modèles (à part que les données d'exemple ne me semblent pas très "gonflées à zéro" ...); en fait, aucun des modèles ne donne une estimation à mi-chemin raisonnable du nombre de zéros. Quelqu'un peut-il expliquer quel est l'avantage des modèles zéro gonflé? Je suppose qu'il devait y avoir une raison de choisir cela comme exemple pour la fonction.
la source