La distribution de poisson peut-elle être utilisée pour analyser des données continues ainsi que des données discrètes?
J'ai quelques ensembles de données où les variables de réponse sont continues, mais ressemblent à une distribution de poisson plutôt qu'à une distribution normale. Cependant, la distribution de poisson est une distribution discrète et concerne généralement les nombres ou les dénombrements.
Réponses:
L'hypothèse clé d'un modèle linéaire généralisé pertinent ici est la relation entre la variance et la moyenne de la réponse, compte tenu des valeurs des prédicteurs. Lorsque vous spécifiez une distribution de Poisson, cela implique que vous supposez que la variance conditionnelle est égale à la moyenne conditionnelle. * La forme réelle de la distribution n'a pas autant d'importance: il peut s'agir de Poisson ou gamma ou normal, ou toute autre chose aussi longtemps que cette relation moyenne-variance tient.
* Vous pouvez assouplir l'hypothèse que la variance est égale à la moyenne de l'un de la proportionnalité, et toujours obtenir de bons résultats.
la source
Si vous parlez d'utiliser une réponse de Poisson dans un modèle linéaire généralisé, alors oui, si vous êtes prêt à faire l'hypothèse que la variance de chaque observation est égale à sa moyenne.
Si vous ne voulez pas faire cela, une autre alternative peut être de transformer la réponse (par exemple, prendre des journaux).
la source
quasipoisson
famille dansglm
.log
transformation aurait fonctionné, pourquoi discrétiser vos données? Utilisation deglm
travaux, mais chaque résultat est basé sur des asymptotiques (qui peuvent ou non tenir le coup)