J'essaie actuellement d'appliquer un modèle linéaire ( family = gaussian
) à un indicateur de biodiversité qui ne peut pas prendre des valeurs inférieures à zéro, est gonflé à zéro et est continu. Les valeurs vont de 0 à un peu plus de 0,25. En conséquence, il y a un schéma assez évident dans les résidus du modèle dont je n'ai pas réussi à me débarrasser:
Quelqu'un at-il des idées sur la façon de résoudre ce problème?
Réponses:
Il existe une variété de solutions au cas des distributions (semi-) continues gonflées à zéro:
Ou, si votre structure de données est assez simple, vous pouvez simplement utiliser des modèles linéaires et utiliser des tests de permutation ou une autre approche robuste pour vous assurer que votre inférence n'est pas gâchée par la distribution intéressante des données.
Des packages / solutions R sont disponibles pour la plupart de ces cas.
Il y a d'autres questions sur SE concernant les données (semi) continues gonflées à zéro (par exemple ici , ici et ici ), mais elles ne semblent pas offrir une réponse générale claire ...
Voir également Min & Agresti, 2002, Modelling Nonnegative Data with Clumping at Zero: A Survey pour une vue d'ensemble.
la source