J'ai utilisé le MCMCglmm
package récemment. Je suis confus par ce que l'on appelle dans la documentation structure R et structure G. Ceux-ci semblent se rapporter aux effets aléatoires - en particulier en spécifiant les paramètres de la distribution antérieure sur eux, mais la discussion dans la documentation semble supposer que le lecteur sait ce que sont ces termes. Par exemple:
liste facultative des spécifications antérieures ayant 3 éléments possibles: R (structure R) G (structure G) et B (effets fixes) ............ Les a priori pour les structures de variance (R et G ) sont des listes avec les (co) variances (V) et le degré de croyance (nu) attendus pour l'inverse de Wishart
... prise d' ici .
EDIT: Veuillez noter que j'ai réécrit le reste de la question suite aux commentaires de Stéphane.
Quelqu'un peut-il faire la lumière sur ce que sont la structure R et la structure G, dans le contexte d'un modèle de composantes de variance simple où le prédicteur linéaire est avec e 0 i j ∼ N ( 0 , σ 2 0 e ) et u 0 j ∼ N ( 0 , σ 2 0 u )
J'ai fait l'exemple suivant avec quelques données fournies avec MCMCglmm
> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical",
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)
G-structure: ~FSfamily
post.mean l-95% CI u-95% CI eff.samp
FSfamily 0.8529 0.2951 1.455 160
R-structure: ~units
post.mean l-95% CI u-95% CI eff.samp
units 1 1 1 0
Location effects: Pupated ~ 1
post.mean l-95% CI u-95% CI eff.samp pMCMC
(Intercept) -1.1630 -1.4558 -0.8119 463.1 <0.001 ***
---
> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical",
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)
G-structure: ~FSfamily
post.mean l-95% CI u-95% CI eff.samp
FSfamily 0.8325 0.3101 1.438 79.25
R-structure: ~units
post.mean l-95% CI u-95% CI eff.samp
units 0.7212 0.04808 2.427 3.125
Location effects: Pupated ~ 1
post.mean l-95% CI u-95% CI eff.samp pMCMC
(Intercept) -1.1042 -1.5191 -0.7078 20.99 <0.001 ***
---
> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation
Formula: Pupated ~ 1 + (1 | FSfamily)
Data: PlodiaRB
AIC BIC logLik deviance
1020 1029 -508 1016
Random effects:
Groups Name Variance Std.Dev.
FSfamily (Intercept) 0.56023 0.74849
Number of obs: 874, groups: FSfamily, 49
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.9861 0.1344 -7.336 2.2e-13 ***
Donc, sur la base des commentaires de Stéphane, je pense que la structure G est pour . Mais les commentaires disent également que la structure R est pour σ 2 0 e mais cela ne semble pas apparaître dans la sortie.lme4
Notez que les résultats de lme4/glmer()
sont cohérents avec les deux exemples de MCMC MCMCglmm
.
La structure R de et pourquoi n'apparaît-elle pas dans la sortie de ?lme4/glmer()
la source
lme4
Réponses:
Je préférerais poster mes commentaires ci-dessous en tant que commentaire mais cela ne serait pas suffisant. Ce sont des questions plutôt qu'une réponse (tout comme @gung, je ne me sens pas assez fort sur le sujet).
J'ai l'impression que MCMCglmm n'implémente pas un "vrai" glmm bayésien. Le vrai modèle bayésien est décrit dans la section 2 de cet article . De façon similaire au modèle fréquentiste, on a et il y a un préalable requis sur le paramètre de dispersion ϕ 1 en plus des paramètres fixes β et de la variance "G" de la effet aléatoire u .g(E(y∣u))=Xβ+Zu ϕ1 β u
Veuillez vous excuser pour ces commentaires approximatifs, je viens de jeter un coup d'œil à ce sujet.
la source
glmer
et je suis très curieux de votre commentaire quiMCMCglmm
n'est pas vraiment bayésien. Je ne peux pas honnêtement dire que je comprends tout le document auquel vous avez lié et je me bats également avec des parties de laMCMCglmm
vignette, mais simplement du point de vue de mon exemple, je crois que le paramètre de dispersionMCMCglmm
utilisant une variété de paramètres, et les intervalles crédibles à 95% contiennent toujours la valeur de la variance pour l'estimation des effets aléatoires parglmer
donc j'ai estimé que c'était raisonnable , mais comment dois-je interpréter ce cas, qui peut ne pas être typique, d'où le résultat que lesMCMCglmm
intervalles ne sont pas très sensibles au choix du prior? Peut-être que je devrais poser une nouvelle question à ce sujet?glmer
. I even tried an improper flat prior, which gave 0.10 (0.08, 0.13) and 0.47 (0.25, 0.68).I am late to the game, but a few notes. TheR structure is the residual structure. In your case, the "structure" only has a single element (but this need not be the case). For Gaussian response variable, the residual variance, σ2e is typically estimated. For binary outcomes, it is held constant. Because of how MCMCglmm is setup, you cannot fix it at zero, but it is relatively standard to fix it at 1 (also true for a probit model). For count data (e.g., with a poisson distribution), you do not fix it and this automatically estimates an overdispersion parameter essentially.
Theg structure est la structure à effets aléatoires. Encore une fois dans votre cas, juste une interception aléatoire, mais si vous aviez plusieurs effets aléatoires, ils formeraient une matrice de variance-covariance,g .
Une note finale, parce que la variance résiduelle n'est pas fixée à zéro, les estimations ne correspondront pas à celles de
glmer
. You need to rescale them. Here is a little example (not using random effects, but it generalizes). Note how the R structure variance is fixed at 1.Voici la constante de mise à l'échelle pour la famille binomiale:
Maintenant, divisez la solution et obtenez les modes postérieurs
Ce qui devrait être assez proche de ce que nous obtenons
glm
la source
123
, je reçois (avec la correction) desm2
valeurs-8.164
et0.421
; et desglm
valeurs-8.833
et0.430
.