J'ai la sortie suivante:
Generalized linear mixed model fit by the Laplace approximation
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape)
AIC BIC logLik deviance
4062 4093 -2022 4044
Random effects:
Groups Name Variance Std.Dev.
landscape (Intercept) 0.82453 0.90804
Number of obs: 239, groups: landscape, 45
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.65120 0.14051 18.868 <2e-16
sMFS2 0.26922 0.17594 1.530 0.1260
sAG2 0.09268 0.14529 0.638 0.5235
sSHDI2 0.28345 0.17177 1.650 0.0989
sbare 0.41388 0.02976 13.907 <2e-16
seasonlate -0.50165 0.02729 -18.384 <2e-16
cropforage 0.79000 0.06724 11.748 <2e-16
cropsoy 0.76507 0.04920 15.551 <2e-16
Correlation of Fixed Effects:
(Intr) sMFS2 sAG2 sSHDI2 sbare sesnlt crpfrg
sMFS2 -0.016
sAG2 0.006 -0.342
sSHDI2 -0.025 0.588 -0.169
sbare -0.113 -0.002 0.010 0.004
seasonlate -0.034 0.005 -0.004 0.001 -0.283
cropforage -0.161 -0.005 0.012 -0.004 0.791 -0.231
cropsoy -0.175 -0.022 0.013 0.013 0.404 -0.164 0.557
Toutes mes variables continues (désignées par un petit s
devant le nom de la variable) sont normalisées (z-scores). season
est une variable catégorielle à 2 niveaux (précoce et tardive), et crop
est une variable catégorielle à 3 niveaux (maïs, fourrage et soja).
Cette corrélation de la matrice des effets fixes me déroute vraiment, car toutes les corrélations ont le signe opposé qu'elles font quand je regarde les régressions simples de paires de variables. c'est-à-dire que la matrice de corrélation des effets fixes suggère une forte corrélation positive entre cropforage
et sbare
, alors qu'en fait il existe une très forte corrélation NÉGATIVE entre ces variables - les cultures fourragères avaient tendance à avoir beaucoup moins de terrain nu que les cultures de maïs et de soja. Des paires de variables continues ont le même problème, la corrélation de la matrice des effets fixes dit que tout est à l'opposé de ce qu'il devrait être ... Cela pourrait-il simplement être dû à la complexité du modèle (n'étant pas une simple régression)? Cela pourrait-il être lié au fait que les variables sont normalisées?
Merci.
Si vos corrélations négatives et positives sont les mêmes dans leur valeur et que seul leur signe diffère, vous entrez la variable par erreur. Mais je ne pense pas que ce soit le cas pour vous car vous semblez déjà assez avancé dans les statistiques.
L'incohérence que vous rencontrez peut être et est probablement causée par la multicolinéarité. Cela signifie que certaines variables indépendantes partagent des effets qui se chevauchent ou, en d'autres termes, sont elles-mêmes corrélées . par exemple, la modélisation des variables "taux de croissance" et "taille de la tumeur" peut entraîner une multicolinéarité, car il est possible et probable que les tumeurs plus grandes aient des taux de croissance plus élevés (avant d'être détectés) en soi. Cela peut confondre le modèle. Et si votre modèle a peu de variables indépendantes qui sont corrélées les unes aux autres, l'interprétation des résultats peut parfois devenir assez difficile. Elle conduit parfois à des coefficients totalement étranges, voire à des degrés tels que le signe de certaines corrélations s'inverse.
Vous devez d'abord détecter les sources de multicolinéarité et les traiter, puis relancer votre analyse.
la source
Il peut être utile de montrer que ces corrélations entre effets fixes sont obtenues en convertissant le "vcov" du modèle en une matrice de corrélation. Si
fit
c'est votre modèle lme4 équipé, alorset les corrélations entre les effets fixes sont les entrées hors diagonale.
la source