Je viens de lancer un GLM binomial négatif et voici la sortie:
Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat,
init.theta = 1.080668549, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2452 -0.9973 -0.3028 0.3864 1.8727
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.6954 0.1152 14.720 < 2e-16 ***
method.L -0.6828 0.1637 -4.171 3.04e-05 ***
site.L 0.9952 0.2050 4.854 1.21e-06 ***
site.Q -0.4634 0.1941 -2.387 0.017 *
depth.L 0.8951 0.1988 4.502 6.74e-06 ***
depth.Q 0.2060 0.1984 1.038 0.299
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)
Null deviance: 185.1 on 89 degrees of freedom
Residual deviance: 100.8 on 84 degrees of freedom
AIC: 518.24
Mes prédicteurs sont tous catégoriques. Est-ce pourquoi je reçois .L
et .Q
. Je suppose qu'ils représentent les différentes catégories, mais quelqu'un connaît-il un code que je pourrais utiliser pour les étiqueter avant d'exécuter le GLM afin qu'ils apparaissent à la place comme les différentes catégories?
glm
.Réponses:
Vos variables ne sont pas seulement codées en tant que facteurs (pour les rendre catégoriques), elles sont codées en tant que facteurs ordonnés . Ensuite, par défaut, R ajuste une série de fonctions polynomiales aux niveaux de la variable. Le premier est linéaire (
.L
), le second est quadratique (.Q
), le troisième (si vous aviez suffisamment de niveaux) serait cubique, etc. R s'adaptera à une fonction polynomiale de moins que le nombre de niveaux dans votre variable. Par exemple, si vous n'avez que deux niveaux, seule la tendance linéaire conviendrait. De plus, les bases polynomiales utilisées sont orthogonales. (Pour ce que ça vaut, rien de tout cela n'est spécifique au R - ou aux modèles binomiaux négatifs - tous les logiciels et types de modèles de régression feraient de même.)Se concentrant spécifiquement sur R, si vous vouliez vos variables à coder comme ordonnée ou non, vous devez utiliser le facteur? :
la source