Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.7422 -1.0257 0.0027 0.7169 3.5347
Coefficients:
Estimate Std.Error z value Pr(>|z|)
(Intercept) 3.144257 0.218646 14.381 < 2e-16 ***
riverWatauga -0.049016 0.051548 -0.951 0.34166
pH 0.086460 0.029821 2.899 0.00374 **
temp -0.059667 0.009149 -6.522 6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21
Je veux savoir comment interpréter chaque estimation de paramètre dans le tableau ci-dessus.
Réponses:
Je ne pense pas que le titre de votre question reflète précisément ce que vous demandez.
La question de savoir comment interpréter les paramètres dans un GLM est très large car le GLM est une classe très large de modèles. Rappelons qu'un GLM modélise une variable de réponsey supposée suivre une distribution connue de la famille exponentielle, et que nous avons choisi une fonction inversible telle que
E [ yg
pour J variables prédictives x . Dans ce modèle, l'interprétation de tout paramètre particulier β j est le taux de variation de g ( y ) par rapport à x j
Ce qui signifie simplement que est l'effet sur η d'une augmentation unitaire deβj η .xj
Vous pouvez également énoncer la relation de cette manière: et E
Sans rien savoir de , c'est aussi loin que nous pouvons obtenir. β j est l'effet sur η , sur la moyenne conditionnelle transformée de y , d'une augmentation unitaire de x j , et l'effet sur la moyenne conditionnelle de y d'une augmentation unitaire de x j estg βj η y xj y xj g−1(β) .
ce qui signifie enfin quelque chose de tangible:
There are three important pieces to note here:
So in your example, the effect of increasing pH by 1 is to increaselny^ by y^(e0.09−1) ; that is, to multiply y^ by e0.09≈1.09 . It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.
la source
My suggestion would be to create a small grid consisting of combinations of the two rivers and two or three values of each of the covariates, then use the
predict
function with your grid asnewdata
. Then graph the results. It is much clearer to look at the values that the model actually predicts. You may or may not want to back-transform the predictions to the original scale of measurement (type = "response"
).la source