Comment interpréter les coefficients d'une régression bêta?

15

J'ai des données limitées entre 0 et 1. J'ai utilisé le betaregpackage dans R pour adapter un modèle de régression avec les données limitées comme variable dépendante. Ma question est: comment interpréter les coefficients de la régression?

Thomas Jensen
la source
1
Lisez ce pdf: cran.r-project.org/web/packages/betareg/vignettes/betareg.pdf Beaucoup d'exemples utiles qui devraient répondre à votre question.
1
Merci, j'ai regardé le pdf, mais je ne sais toujours pas comment interpréter les coefficients
Thomas Jensen
1
Aucun problème. Je posterai une réponse ci-dessous.

Réponses:

28

Vous devez donc déterminer à quelle échelle vous modélisez la réponse. Dans le cas de la betaregfonction dans R, nous avons le modèle suivant

logit(yje)=β0+je=1pβje

où le est la cote de log habituelle à laquelle nous sommes habitués lorsque nous utilisons le lien logit dans la fonction (c.-à-d. le binôme familial) dans R. Ainsi, les coefficients bêta qui retournent sont l'augmentation supplémentaire (ou la diminution) si la version bêta est négative) dans les log-odds de votre réponse. Je suppose que vous voulez être en mesure d'interpréter les bêtas sur l'échelle de probabilité (c'est-à-dire sur l'intervalle (0,1)) donc une fois que vous avez vos coefficients bêta, tout ce que vous devez faire est simplement de changer la réponse, c'est-à-dire,logit(yje)glmbetareg

logit(yje)=β0+je=1pβjeyje=eβ0+je=1pβje1+eβ0+je=1pβje

Ainsi, vous devez comprendre que nous utilisons essentiellement les mêmes résultats et interprétations de la modélisation linéaire généralisée standard (sous le lien logit). L'une des principales différences entre la régression logistique et la régression bêta est que vous permettez à la variance de votre réponse d'être beaucoup plus grande qu'elle ne pourrait l'être dans la régression logistique afin de traiter le problème typique de la sur-dispersion.

Nick Cox
la source
Génial, très apprécié !!
Thomas Jensen
@Nick Cox Nick alors quand si vous aviez une réponse proportionnelle qui était une proportion d'espèces observées et une variable indépendante TEMPERATURE. Ma confusion avec un betareg est ce que le coefficient indique une augmentation de .... les chances de quoi? Dans une régression logistique typique, car le résultat est catégorique, je comprends intuitivement qu'il y a une augmentation des chances d'être dans une catégorie MAIS avec un résultat proportionnel continu, comment pouvez-vous expliquer une augmentation avec des chances? Si la température coef est de 0,05, alors exp (0,05) = 1,05, ce qui signifie qu'une augmentation d'une unité de la température entraîne une augmentation de 1,05 de quoi?
user3022875
@ user3022875 Dans l'exemple que vous donnez, cela représente une augmentation du rapport de la proportion d'espèces observées à la proportion d'espèces non observées. La cote n'est que le rapport entre les classes positives et négatives (p / 1-p), donc plutôt que de dire «cote», vous pouvez simplement décrire le rapport explicitement.
Bryan Shalloway
2
ainsi, dans l'exemple de l'utilisateur 3022875, l'interprétation serait: une augmentation d'unité de la température entraîne une augmentation de 5% du rapport entre la proportion d'espèces observées et la proportion d'espèces non observées. ou tout simplement, une augmentation d'unité de la température entraîne une augmentation de 5% du rapport des proportions d'espèces observées. est-ce vrai, @BryanShalloway?
user1607