Comment interpréter les principaux effets (coefficients du facteur factice) dans une régression de Poisson?
Supposons l'exemple suivant:
treatment <- factor(rep(c(1, 2), c(43, 41)),
levels = c(1, 2),
labels = c("placebo", "treated"))
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
levels = c(1, 2, 3),
labels = c("none", "some", "marked"))
numberofdrugs <- rpois(84, 10) + 1
healthvalue <- rpois(84, 5)
y <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)
La sortie est:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.88955 0.19243 9.819 <2e-16 ***
numberofdrugs -0.02303 0.01624 -1.418 0.156
treatmenttreated -0.01271 0.10861 -0.117 0.907 MAIN EFFECT
improvedsome -0.13541 0.14674 -0.923 0.356 MAIN EFFECT
improvedmarke -0.10839 0.12212 -0.888 0.375 MAIN EFFECT
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Je sais que le taux d'incident pour numberofdrugs
est exp(-0.023)=0.977
. Mais comment interpréter les principaux effets pour les variables nominales?
r
generalized-linear-model
interpretation
poisson-distribution
regression-coefficients
gung - Rétablir Monica
la source
la source
Réponses:
Le
numberofdrugs
coefficient exponentiaire est le terme multiplicatif à utiliser pour calculer l'estimation dehealthvalue
quandnumberofdrugs
augmente de 1 unité. Dans le cas de variables qualitatives (de facteur), le coefficient exponentiel est le terme multiplicatif relatif au niveau de base (premier facteur) de cette variable (puisque R utilise les contrastes de traitement par défaut). Leexp(Intercept)
est le taux de base, et toutes les autres estimations seraient relatives à celui-ci.Dans votre exemple, l’estimation
healthvalue
pour une personne avec des2
drogues,"placebo"
etimprovement=="none"
serait (en utilisant addition dans exp comme équivalent à la multiplication):Alors que quelqu'un sur la
4
drogue,"treated"
et l'"some"
amélioration aurait une estimationhealthvalue
deADDENDA: C'est ce que cela signifie d'être "additif à l'échelle logarithmique". "Additive sur l'échelle log-cotes" était la phrase que mon enseignante, Barbara McKnight, utilisait pour souligner la nécessité d'utiliser tous les coefficients de terme appliqués dans la régression logistique pour toute prédiction. Vous ajoutez d’abord tous les coefficients fois les valeurs de la covariable, puis vous l’exposez. La façon de retourner les coefficients des objets de régression dans R consiste généralement à utiliser la
coef()
fonction d'extraction (réalisée avec une réalisation aléatoire différente ci-dessous):Donc, le calcul de l'estimation pour un sujet avec des
4
médicaments"treated"
, avec une"some"
amélioration serait:Et le prédicteur linéaire pour ce cas devrait être la somme de:
Ces principes devraient s'appliquer à tout package de statistiques qui renvoie une table de coefficients à l'utilisateur. La méthode et les principes sont plus généraux que cela pourrait paraître de mon utilisation de R.
Je copie les commentaires de clarification sélectionnés car ils "disparaissent" dans l'affichage par défaut:
R: Les coefficients sont les logarithmes naturels des ratios. - DWin
A2: Non. S'il s'agissait d'une régression logistique, ils ne le seraient que dans la régression de Poisson, où LHS est le nombre d'événements et le dénominateur implicite est le nombre en risque, alors les coefficients exponentiés sont des "rapports de taux" ou des "risques relatifs".
la source