Imaginons que nous nous intéressions à la façon dont les notes des étudiants sont affectées par le nombre d'heures que ces étudiants étudient. Pour explorer cette relation, nous pourrions exécuter la régression linéaire suivante:
Mais si nous échantillonnons des élèves de plusieurs écoles différentes, nous pourrions nous attendre à ce que les élèves d'une même école se ressemblent davantage que les élèves de différentes écoles. Pour faire face à ce problème de dépendance, le conseil dans de nombreux manuels / sur le Web, est d'exécuter des effets mixtes et d'entrer à l'école comme un effet aléatoire. Ainsi, le modèle deviendrait: Mais pourquoi cela résout-il le problème de dépendance qui était présent dans la régression linéaire?
Veuillez répondre comme si vous parliez à un enfant de 12 ans
Réponses:
L'inclusion de termes aléatoires dans le modèle est un moyen d'induire une structure de covariance entre les notes. Le facteur aléatoire pour l'école induit une covariance non nul entre les différents élèves de la même école, alors qu'il est quand l'école sont différents.0
Écrivons votre modèle comme où s indexe l'école et i indexe les élèves (dans chaque école). Les termes écoles s sont des variables aléatoires indépendantes dessinées dans un N ( 0 , τ ) . Les e s , i sont des variables aléatoires indépendantes dessinées dans un N ( 0 , σ
Ce vecteur a une valeur attendue qui est déterminée par le nombre d'heures travaillées.
La covariance entre et Y s ′ , i ′ est 0 lorsque sYs,i Ys′,i′ 0 , ce qui signifie que l'écart des notes par rapport aux valeurs attendues est indépendant lorsque les élèves ne sont pas dans la même école.s≠s′
La covariance entre et Y s , iYs,i estτlorsquei≠i′, et la variance deY s , i estτYs,i′ τ i≠i′ Ys,i : les notes des élèves d'une même école auront des écarts corrélés par rapport à leurs valeurs attendues .τ+σ2
Exemple et données simulées
Voici une courte simulation R pour cinquante élèves de cinq écoles (ici je prends ); les noms de la variable sont auto-documentés:σ2=τ=1
La matrice de variance pour cet exemple
la source