Je suis confus quant à l'hypothèse de normalité dans les mesures répétées ANOVA. Plus précisément, je me demande quel type de normalité doit être satisfait exactement. En lisant la littérature et les réponses sur CV, je suis tombé sur trois formulations distinctes de cette hypothèse.
La variable dépendante dans chaque condition (répétée) doit être distribuée normalement.
On dit souvent que rANOVA a les mêmes hypothèses que ANOVA, plus la sphéricité. C'est ce que prétendent les statistiques de Field's Discovering ainsi que l' article de Wikipedia sur le sujet et le texte de Lowry .
Les résidus (différences entre toutes les paires possibles?) Doivent être distribués normalement.
J'ai trouvé cette déclaration dans plusieurs réponses sur CV ( 1 , 2 ). Par analogie de rANOVA avec le test t apparié , cela peut également sembler intuitif.
La normalité multivariée doit être satisfaite.
Wikipédia et cette source le mentionnent. De plus, je sais que rANOVA peut être échangé avec MANOVA, ce qui pourrait mériter cette affirmation.
Ces équivalents sont-ils en quelque sorte? Je sais que la normalité multivariée signifie que toute combinaison linéaire des DV est normalement distribuée, donc 3. inclurait naturellement 2. si je comprends bien ce dernier.
Si ce ne sont pas les mêmes, quelle est la "vraie" hypothèse de la rANOVA? Pouvez-vous fournir une référence?
Il me semble que la première revendication est la plus appuyée. Ce n'est cependant pas conforme aux réponses habituellement fournies ici.
Modèles mixtes linéaires
En raison de l'allusion de @ utobi, je comprends maintenant comment rANOVA peut être reformulé en tant que modèle mixte linéaire. Plus précisément, pour modéliser l'évolution de la pression artérielle avec le temps, je modéliserais la valeur attendue comme : où sont des mesures de la pression artérielle, la pression artérielle moyenne du ème sujet, et comme ème fois que le ème sujet a été mesuré, indiquant que le changementy i j a i i t i j j i
Enfin, j'ai essayé de réfléchir à ce que cela signifie pour la normalité, mais sans grand succès. Pour paraphraser McCulloch et Searle (2001, p. 35. Eq. (2.14)):
Je comprends que cela signifie que
4. Les données de chaque individu doivent être distribuées normalement, mais ce n'est pas raisonnable de tester avec peu de points dans le temps.
Je prends la troisième expression pour signifier que
5. les moyennes des sujets individuels sont normalement distribuées. Notez que ce sont deux autres possibilités distinctes en plus des trois mentionnées ci-dessus.
McCulloch, CE et Searle, SR (2001). Modèles généralisés, linéaires et mixtes . New York: John Wiley & Sons, Inc.
Réponses:
Il s'agit du modèle ANOVA à mesures répétées le plus simple si nous le traitons comme un modèle univarié:
où représente chaque cas et les moments où nous les avons mesurés (donc les données sont sous forme longue). représente les résultats empilés les uns sur les autres, représente la moyenne de chaque cas, représente la moyenne de chaque point dans le temps et représente les écarts des mesures individuelles du cas et le point de temps signifie. Vous pouvez inclure des facteurs intermédiaires supplémentaires comme prédicteurs dans cette configuration.t y i t a i b t ϵ i tje t yje t uneje bt ϵje t
Nous n'avons pas besoin de faire d'hypothèses de distribution sur , car elles peuvent entrer dans le modèle sous forme d'effets fixes, de variables muettes (contrairement à ce que nous faisons avec les modèles mixtes linéaires). Il en va de même pour les nuls de temps. Pour ce modèle, il vous suffit de régresser le résultat sous forme longue par rapport aux variables muettes personne et aux variables muettes temps. L'effet d'intérêt est le temps factice , le test qui teste l'hypothèse nulle selon laquelle est le test principal dans les mesures répétées univariées ANOVA. F b 1 = . . . = b t = 0uneje F b1= . . . = bt= 0
Quelles sont les hypothèses requises pour que le test se comporte correctement? Celui qui correspond à votre question est:F
Il existe des hypothèses supplémentaires (plus conséquentes) pour que le test soit valide, car on peut voir que les données ne sont pas indépendantes les unes des autres puisque les individus se répètent sur plusieurs lignes.F
Si vous souhaitez traiter les mesures répétées de l'ANOVA comme un modèle multivarié, les hypothèses de normalité peuvent être différentes, et je ne peux pas les développer au-delà de ce que vous et moi avons vu sur Wikipédia.
la source
L'explication de la normalité de l'ANOVA à mesures répétées peut être trouvée ici:
Comprendre les hypothèses ANOVA de mesures répétées pour une interprétation correcte de la sortie SPSS
Vous avez besoin de la normalité des variables dépendantes dans les résidus (cela implique une distribution normale dans tous les groupes, avec une variance commune et une moyenne dépendante du groupe), comme dans la régression.3 → 1 3 → 2 5
Comme vous l'avez remarqué, la normalité multivariée implique que toutes les combinaisons linéaires des variables dépendantes sont normalement distribuées, c'est donc un concept plus fort que la normalité des variables uniques ( ). Cependant, je ne suis pas convaincu que cela implique la normalité des résidus ( ), étant donné que les résidus sont également déterminés par des variables indépendantes (groupes, en ANOVA). Je suis d'accord avec vous pour le point : vous parlez essentiellement d'un effet aléatoire au niveau individuel ayant une distribution normale.
la source