J'ai exécuté une conception répétée selon laquelle j'ai testé 30 hommes et 30 femmes à travers trois tâches différentes. Je veux comprendre en quoi le comportement des hommes et des femmes est différent et comment cela dépend de la tâche. J'ai utilisé à la fois le package lmer et lme4 pour enquêter sur cela, cependant, je suis coincé à essayer de vérifier les hypothèses pour l'une ou l'autre méthode. Le code que je lance est
lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat)
lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat)
J'ai vérifié si l'interaction était le meilleur modèle en le comparant avec le modèle plus simple sans l'interaction et en exécutant une anova:
lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat)
lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat)
anova(lm.base1, lm.full)
anova(lm.base2, lm.full2)
Q1: Est-il acceptable d'utiliser ces prédicteurs catégoriels dans un modèle mixte linéaire?
Q2: Dois-je comprendre correctement que la variable de résultat ("comportement") n'a pas besoin d'être distribuée normalement elle-même (par sexe / tâches)?
Q3: Comment puis-je vérifier l'homogénéité de la variance? Pour un modèle linéaire simple que j'utilise plot(LM$fitted.values,rstandard(LM))
. L'usage est-il plot(reside(lm.base1))
suffisant?
Q4: Pour vérifier la normalité, utilisez le code suivant, ok?
hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), freq = FALSE); curve(dnorm, add = TRUE)
la source
Réponses:
Q1: Oui - comme tout modèle de régression.
Q2: Tout comme les modèles linéaires généraux, votre variable de résultat n'a pas besoin d'être normalement distribuée en tant que variable univariée. Cependant, les modèles LME supposent que les résidus du modèle sont normalement distribués. Ainsi, une transformation ou l'ajout de poids au modèle serait un moyen de prendre soin de cela (et de vérifier avec des parcelles de diagnostic, bien sûr).
Q3:
plot(myModel.lme)
Q4:
qqnorm(myModel.lme, ~ranef(., level=2))
. Ce code vous permettra de faire des tracés QQ pour chaque niveau des effets aléatoires. Les modèles LME supposent que non seulement les résidus intra-grappes sont normalement distribués, mais que chaque niveau des effets aléatoires l'est également. Faites varier les valeurslevel
de 0, 1 à 2 afin de pouvoir vérifier les résidus de rat, de tâche et intra-sujet.EDIT: Je dois également ajouter que si la normalité est supposée et que la transformation aide probablement à réduire les problèmes avec des erreurs / effets aléatoires non normaux, il n'est pas clair que tous les problèmes sont réellement résolus ou qu'aucun biais n'est introduit. Si vos données nécessitent une transformation, soyez prudent quant à l'estimation des effets aléatoires. Voici un document traitant de cela .
la source
Vous semblez assez trompeur sur les hypothèses entourant les modèles à plusieurs niveaux. Il n'y a pas d'hypothèse d'homogénéité de variance dans les données, juste que les résidus doivent être distribués approximativement normalement. Et les prédicteurs catégoriques sont utilisés dans la régression tout le temps (la fonction sous-jacente dans R qui exécute une ANOVA est la commande de régression linéaire).
Pour plus de détails sur l'examen des hypothèses, consultez le livre Pinheiro et Bates (p. 174, section 4.3.1). De plus, si vous prévoyez d'utiliser lme4 (dans lequel le livre n'est pas écrit), vous pouvez répliquer leurs tracés en utilisant plot avec un
lmer
modèle (?plot.merMod
).Pour vérifier rapidement la normalité, ce serait juste
qqnorm(resid(myModel))
.la source
Concernant Q2:
Selon le livre de Pinheiro et Bates, vous pouvez utiliser l'approche suivante:
Si vous souhaitez vérifier des écarts égaux entre
sex
vous pouvez utiliser cette approche:Si les écarts sont différents, vous pouvez mettre à jour votre modèle de la manière suivante:
De plus, vous pouvez jeter un œil à l'
robustlmm
emballage qui utilise également une approche de pesée. La thèse de Koller sur ce concept est disponible en libre accès ("Robust Estimation of Linear Mixed Models"). Le résumé déclare:Je n'ai pas assez de points pour les commentaires. Je vois cependant la nécessité de clarifier un aspect de la réponse de @John ci-dessus. Pinheiro et Bates déclarent à la p. 174:
Cette affirmation n'est en effet pas claire sur les variances homogènes et je ne suis pas assez en profondeur dans les statistiques pour connaître tous les mathématiques derrière le concept LME. Cependant, à la p. 175, §4.3.1, la section traitant de l' hypothèse 1, ils écrivent:
De plus, dans les exemples suivants, les " variances constantes " sont en effet importantes. Ainsi, on peut spéculer s'ils impliquent des variances homogènes lorsqu'ils écrivent " identiquement normalement distribués" sur p. 174 sans y répondre plus directement.
la source
Q1: Oui, pourquoi pas?
Q2: Je pense que l'exigence est que les erreurs soient normalement distribuées.
Q3: Peut être testé avec le test de Leven par exemple.
la source