Calcul de la répétabilité des effets d'un modèle lmer

28

Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait:

#fit the model
fit = lmer(dv~(1|unit),data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
intercept_var = attr(vc$id,'stddev')[1]^2

#compute the unadjusted repeatability
R = intercept_var/(intercept_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit))
    k = nrow(n)
    N = sum(n$Freq)
n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Je pense que cette approche peut également être utilisée pour calculer la fiabilité des effets (c'est-à-dire l'effet de contraste de la somme d'une variable à 2 niveaux), comme dans:

#make sure the effect variable has sum contrasts
contrasts(my_data$iv) = contr.sum

#fit the model
fit = lmer(dv~(iv|unit)+iv,data=my_data)

#obtain the variance estimates
vc = VarCorr(fit)
residual_var = attr(vc,'sc')^2
effect_var = attr(vc$id,'stddev')[2]^2

#compute the unadjusted repeatability
R = effect_var/(effect_var+residual_var)

#compute n0, the repeatability adjustment
n = as.data.frame(table(my_data$unit,my_data$iv))
k = nrow(n)
N = sum(n$Freq)
    n0 = (N-(sum(n$Freq^2)/N))/(k-1)

#compute the adjusted repeatability
Rn = R/(R+(1-R)/n0)

Trois questions:

  1. Les calculs ci-dessus pour obtenir l'estimation ponctuelle de la répétabilité d'un effet ont-ils un sens?
  2. Lorsque j'ai plusieurs variables dont je veux estimer la répétabilité, les ajouter toutes au même ajustement (par exemple lmer(dv~(iv1+iv2|unit)+iv1+iv2) semble donner des estimations de répétabilité plus élevées que de créer un modèle distinct pour chaque effet. Cela a du sens pour moi sur le plan du calcul, car l'inclusion d'effets multiples aura tendance à diminuer la variance résiduelle, mais je ne suis pas certain que les estimations de répétabilité qui en résultent soient valides. Sont-ils?
  3. L'article cité ci-dessus suggère que le profil de vraisemblance pourrait m'aider à obtenir des intervalles de confiance pour les estimations de répétabilité, mais pour autant que je sache, confint(profile(fit))ne fournit que des intervalles pour les variances d'interception et d'effet, alors que j'aurais également besoin de l'intervalle pour la variance résiduelle pour calculer l'intervalle pour la répétabilité, non?
Mike Lawrence
la source

Réponses:

6

Je pense que je peux répondre à vos questions au moins concernant les estimations de répétabilité non ajustées, c'est-à-dire les corrélations classiques intra-classe (ICC). Quant aux estimations de répétabilité "ajustées", j'ai survolé le papier que vous avez lié et je n'ai pas vraiment vu où la formule que vous appliquez peut être trouvée dans le papier? Sur la base de l'expression mathématique, il semble que ce soit la répétabilité des scores moyens (plutôt que des scores individuels). Mais il n'est pas clair que c'est de toute façon une partie essentielle de votre question, donc je l'ignorerai.

(1.) Les calculs ci-dessus pour obtenir l'estimation ponctuelle de la répétabilité d'un effet ont-ils un sens?

Oui, l'expression que vous proposez a du sens, mais une légère modification de la formule que vous proposez est nécessaire. Ci-dessous, je montre comment on pourrait dériver votre coefficient de répétabilité proposé. J'espère que cela clarifie à la fois la signification conceptuelle du coefficient et montre également pourquoi il serait souhaitable de le modifier légèrement.

Pour commencer, prenons d'abord le coefficient de répétabilité dans votre premier cas et clarifions ce qu'il signifie et d'où il vient. Comprendre cela nous aidera à comprendre le deuxième cas plus compliqué.

Interceptions aléatoires uniquement

jej

yjej=β0+u0j+ejej,
u0jσu02ejejσe2

Xy

corr=cov(X,y)vuner(X)vuner(y).

Xyj

jeCC=cov(β0+u0j+eje1j,β0+u0j+eje2j)vuner(β0+u0j+eje1j)vuner(β0+u0j+eje2j),
jeCC=σu02σu02+σe2.

Interceptions aléatoires et pentes aléatoires

Maintenant, pour le deuxième cas, nous devons d'abord clarifier ce que l'on entend précisément par «la fiabilité des effets (c'est-à-dire l'effet de contraste de la somme d'une variable à 2 niveaux)» - vos mots.

Nous exposons d'abord le modèle. Le modèle mixte pour le jejkX

yjejk=β0+β1Xk+u0j+u1jXk+ejejk,
σu02σu12σu01ejejσe2

jje

Ainsi, la paire de scores de différence en question serait (rappelez-vous que nous avons supposé que est codé en contraste de sorte queX|X1|=|X2|=X

yje1jk2-yje1jk1=(β0-β0)+β1(Xk2-Xk1)+(u0j-u0j)+u1j(Xk2-Xk1)+(eje1jk2-eje1jk1)=2Xβ1+2Xu1j+eje1jk2-eje1jk1
yje2jk2-yje2jk1=2Xβ1+2Xu1j+eje2jk2-eje2jk1.

Le fait de les brancher à la formule de corrélation nous donne

jeCC=cov(2Xβ1+2Xu1j+eje1jk2-eje1jk1,2Xβ1+2Xu1j+eje2jk2-eje2jk1)vuner(2Xβ1+2Xu1j+eje1jk2-eje1jk1)vuner(2Xβ1+2Xu1j+eje2jk2-eje2jk1),
jeCC=2X2σu122X2σu12+σe2.
XX

X±12

(2.) Lorsque j'ai plusieurs variables dont je veux estimer la répétabilité, les ajouter toutes au même ajustement (par exemple lmer(dv~(iv1+iv2|unit)+iv1+iv2) semble donner des estimations de répétabilité plus élevées que la création d'un modèle distinct pour chaque effet. Cela a du sens pour moi sur le plan du calcul, car l'inclusion d'effets multiples aura tendance à diminuer la variance résiduelle, mais je ne suis pas certain que les estimations de répétabilité qui en résultent soient valides. Sont-ils?

Je crois que travailler sur une dérivation similaire à celle présentée ci-dessus pour un modèle à prédicteurs multiples avec leurs propres pentes aléatoires montrerait que le coefficient de répétabilité ci-dessus serait toujours valide, à l' exception de la complication supplémentaire que les scores de différence qui nous intéressent conceptuellement le seraient désormais. ont une définition légèrement différente: à savoir, nous nous intéressons à la corrélation attendue des différences entre les moyennes ajustées après contrôle des autres prédicteurs du modèle.

Si les autres prédicteurs sont orthogonaux au prédicteur d'intérêt (comme, par exemple, dans une expérience équilibrée), je pense que le coefficient ICC / répétabilité élaboré ci-dessus devrait fonctionner sans aucune modification. S'ils ne sont pas orthogonaux, vous devrez modifier la formule pour en tenir compte, ce qui pourrait se compliquer, mais j'espère que ma réponse a donné quelques indications sur ce à quoi cela pourrait ressembler.

Jake Westfall
la source
RRn