J'espère que quelqu'un pourra fournir un aperçu intuitif de ce qu'est la distribution quasi-binomiale et de ce qu'elle fait. Je suis particulièrement intéressé par ces points:
En quoi le quasibinôme diffère de la distribution binomiale.
Lorsque la variable de réponse est une proportion (les valeurs d'exemple incluent 0,23, 0,11, 0,78, 0,98), un modèle quasi-binôme s'exécutera en R mais pas un modèle binomial.
Pourquoi les modèles quasi-binomiaux doivent être utilisés lorsqu'une variable de réponse TRUE / FALSE est sur-dispersée.
R
avecglm.fit
,binomial
etquasibinomial
sont exactement les mêmes, sauf quequasibinomial
(1) supprime la vérification entière et (2) retourne un AIC de NA. Voir cette réponse pour plus de détails.Le quasi-binôme n'est pas nécessairement une distribution particulière; il décrit un modèle pour la relation entre la variance et la moyenne dans les modèles linéaires généralisés qui est fois la variance pour un binôme en termes de moyenne pour un binôme.ϕ
Il existe une distribution qui correspond à une telle spécification (la plus évidente - un binôme à l'échelle), mais ce n'est pas nécessairement le but lorsqu'un modèle quasi binomial est ajusté; si vous vous adaptez à des données qui sont toujours 0-1, elles ne peuvent pas être mises à l'échelle binomiale.
Ainsi, le modèle de variance quasi-binomiale, via le paramètre , peut mieux gérer les données pour lesquelles la variance est plus grande (ou, peut-être, plus petite) que celle que vous obtiendriez avec des données binomiales, sans être nécessairement une distribution réelle du tout .ϕ
Si je me souviens bien, un modèle binomial peut être exécuté en R avec des proportions *, mais vous devez le configurer correctement.
* il y a trois façons différentes de donner des données binomiales à R que je connaisse. Je suis sûr que c'est un.
la source