Suis-je en train de spécifier correctement mon modèle lmer?

9

J'ai parcouru Google et ce site et je suis toujours confus à propos de la fonction lmer dans la bibliothèque lme4.

J'ai quelques données recueillies auprès de différents services psychiatriques, qui ont une structure à plusieurs niveaux. Pour simplifier, je vais choisir deux variables de niveau 2 et deux de niveau 1, bien que j'en ai en fait quelques autres.

Niveau 2 - WardSize [c'est le nombre de personnes dans la salle] & WAS [c'est une mesure de la «gentillesse» de la salle]

La variable de regroupement qui indique à R qui est dans quel quartier est appelée "quartier"

Niveau un - Sexe [c'est le sexe, évidemment] & BSITotal [c'est une mesure de la gravité des symptômes]

Le résultat est Selfreject, qui est à nouveau ce à quoi cela ressemble.

J'ai cette formule:

help = lmer (formule = Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 | Ward))

J'espère que cela signifie que "chaque individu a un score lié à son propre sexe et à la gravité des symptômes, ainsi qu'un effet au niveau de la salle concernant la taille de la salle et à quel point il est" agréable ""

Est-ce correct? Ce qui m'embrouille, c'est que je ne vois pas comment R peut déterminer quelles sont les variables de niveau 1 et quelles sont les variables de niveau 2, à l'exception de l'interception au niveau de la salle donnée à la fin.

Si quelqu'un pouvait expliquer la notation pour qu'un idiot comme moi puisse comprendre, ce serait encore mieux.

Merci beaucoup!

Chris Beeley
la source

Réponses:

11

Les spécifications de votre modèle sont correctes.

L'interception variable pour Ward, spécifiée dans lmer comme vous l'avez fait avec (1 | Ward), indique que les sujets dans chaque pupille peuvent être plus similaires les uns aux autres sur Selfreject pour des raisons autres que WardSize ou Gender, vous contrôlez donc hétérogénéité entre les quartiers.

Vous pouvez considérer le "1" comme une colonne de 1 (c'est-à-dire une constante) dans les données auxquelles une interception est adaptée. Habituellement, le "1" est implicite automatiquement dans lm, par exemple

lm(Y ~ X1 + X2)

spécifie en fait

lm(Y ~ 1 + X1 + X2)

Maintenant que vous avez votre modèle de base, vous pouvez commencer à poser d'autres questions comme "La relation entre BSItotal et Selfreject diffère-t-elle entre les services?"

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

Autrement dit, l'ordonnée à l'origine et la pente de BSITotal peuvent différer entre les quartiers.

Si vous ne l'avez pas encore ramassé, l' analyse des données de Gelman & Hill à l' aide de la régression et des modèles multiniveaux / modèles hiérarchiques est un excellent livre qui explique l'ajustement de modèles comme celui-ci avec lmer.

Mesdames
la source
1

Voici un lien vers une explication de Douglas Bates (qui a écrit lme4) pour expliquer pourquoi il n'est pas nécessaire de spécifier le niveau des effets fixes.

Breyer
la source
2
Bienvenue sur le site, @Breyer. Je soupçonne que c'est une contribution utile. Pourriez-vous donner un bref résumé de l'argument, afin que les lecteurs puissent décider si c'est ce qu'ils recherchent, ou en cas de futur linkrot?
gung - Rétablir Monica
2
Merci pour l'accueil @gung. Bien sûr, Bates explique qu'il n'est pas nécessaire de spécifier des niveaux pour les effets fixes car le package lme4 est écrit pour les modèles mixtes, y compris, mais sans s'y limiter, les modèles multiniveaux / hiérarchiques. Cela signifie que les méthodes de calcul ne reposent pas sur la spécification des niveaux, comme c'est le cas pour les logiciels de régression multiniveaux spécialisés (HLM, etc.) qui exploitent la structure de données imbriquée dans le calcul.
Breyer