Pourquoi les mesures répétées ANOVA supposent-elles la sphéricité?
Par sphéricité, j'entends l'hypothèse que la variance de toutes les différences par paires entre les groupes devrait être la même.
En particulier, je ne comprends pas pourquoi cela devrait être l'hypothèse et non pas que les variances des scores de groupe observés eux-mêmes soient les mêmes.
anova
repeated-measures
assumptions
sphericity
user1205901 - Réintégrer Monica
la source
la source
Réponses:
Intuition derrière l'hypothèse de sphéricité
L'une des hypothèses des mesures communes non répétées, l'ANOVA est une variance égale dans tous les groupes.
(Nous pouvons le comprendre car une variance égale, également connue sous le nom d' homoscédasticité , est nécessaire pour que l'estimateur OLS en régression linéaire soit BLEU et pour que les tests t correspondants soient valides, voir le théorème de Gauss-Markov . Et l'ANOVA peut être implémentée comme linéaire régression.)
Essayons donc de réduire le cas RM-ANOVA au cas non RM. Par souci de simplicité, je traiterai de RM-ANOVA à un facteur (sans aucun effet inter-sujet) qui a sujets enregistrés dans conditions RM.kn k
Chaque sujet peut avoir son propre décalage ou interception spécifique au sujet. Si nous soustrayons les valeurs d'un groupe des valeurs de tous les autres groupes, nous annulerons ces interceptions et arriverons à la situation où nous pourrons utiliser des non-RM-ANOVA pour tester si ces différences de groupe sont toutes nulles. Pour que ce test soit valide, nous avons besoin d'une hypothèse de variances égales de ces différences .k - 1k−1 k−1
Maintenant, nous pouvons soustraire le groupe # 2 de tous les autres groupes, en obtenant à nouveau des différences qui devraient également avoir des variances égales. Pour chaque groupe sur , les variances des différences correspondantes doivent être égales. Il s'ensuit rapidement que toutes les différences possibles doivent être égales.k k - 1 k ( k - 1 ) / 2k−1 k k−1 k(k−1)/2
C'est précisément l'hypothèse de sphéricité.
Pourquoi les variances de groupe ne devraient-elles pas être égales elles-mêmes?
Lorsque nous pensons à RM-ANOVA, nous pensons généralement à un simple modèle additif de style modèle mixte de la forme où sont des effets de sujet, sont des effets de condition, et .α i β j ϵ ∼ N ( 0 , σ 2 )
Pour ce modèle, les différences de groupe suivront , c'est-à-dire auront toutes la même variance , donc la sphéricité tient. Mais chaque groupe suivra un mélange de Gaussiens avec des moyennes à et des variances , qui est une distribution compliquée avec une variance qui est constante entre les groupes.N(βj1−βj2,2σ2) 2σ2 n αi σ2 V(α⃗ ,σ2)
Donc, dans ce modèle, en effet, les variances de groupe sont également les mêmes. Les covariances de groupe sont également les mêmes, ce qui signifie que ce modèle implique une symétrie composée . Il s'agit d'une condition plus stricte par rapport à la sphéricité. Comme le montre mon argument intuitif ci-dessus, RM-ANOVA peut fonctionner correctement dans la situation plus générale, lorsque le modèle additif écrit ci - dessus ne tient pas .
Énoncé mathématique précis
Je vais ajouter ici quelque chose de Huynh & Feldt, 1970, Conditions dans lesquelles les rapports carrés moyens dans les conceptions de mesures répétées ont des distributions exactesF .
Que se passe-t-il lorsque la sphéricité se brise?
Lorsque la sphéricité ne tient pas, nous pouvons probablement nous attendre à ce que RM-ANOVA (i) ait une taille gonflée (plus d'erreurs de type I), (ii) ait une puissance diminuée (plus d'erreurs de type II). On peut l'explorer par des simulations, mais je ne vais pas le faire ici.
la source
Il s'avère que l'effet de la violation de la sphéricité est une perte de puissance (c'est-à-dire une probabilité accrue d'erreur de type II) et une statistique de test (rapport F) qui ne peuvent tout simplement pas être comparées aux valeurs tabulées de la distribution F. Le test F devient trop libéral (c'est-à-dire que la proportion de rejets de l'hypothèse nulle est supérieure au niveau alpha lorsque l'hypothèse nulle est vraie.
Une enquête précise sur ce sujet est très impliquée, mais heureusement Box et al ont écrit un article à ce sujet: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786
Bref, la situation est la suivante. Tout d'abord, disons que nous avons un plan de mesures répétées à un facteur avec des sujets S et des traitements expérimentaux A. Dans ce cas, l'effet de la variable indépendante est testé en calculant la statistique F, qui est calculée comme le rapport du carré moyen de l'effet par le carré moyen de l'interaction entre le facteur sujet et la variable indépendante. Lorsque la sphéricité est vraie, ces statistiques ont une distribution de Fisher avec et degrés de liberté.υ1=A−1 υ2=(A−1)(S−1)
Dans l'article ci-dessus, Box a révélé que lorsque la sphéricité échoue, le nombre correct de degrés de liberté devient du rapport F dépend d'une sphéricité comme ceci:υ1 ϵ
Box a également présenté l'indice de sphéricité, qui s'applique à la matrice de covariance de la population . Si nous appelons les entrées de cette table AxA, alors l'index estξa,a
L'indice de sphéricité de Box est mieux compris par rapport aux valeurs propres d'une matrice de covariance. Rappelons que les matrices de covariance appartiennent à la classe des matrices semi-définies positives et ont donc toujours des valeurs propres positives ou nulles. Ainsi, la condition de sphéricité équivaut à avoir toutes les valeurs propres égales à une constante.
Ainsi, lorsque la sphéricité est violée, nous devons appliquer une correction pour nos statistiques F, et les exemples les plus notables de ces corrections sont Greenhouse-Geisser et Huynh-Feldt, par exemple
Sans aucune correction, vos résultats seront biaisés et donc peu fiables. J'espère que cela t'aides!
la source
Je vais essayer de répondre à cette question dans un cadre simple de mesures répétées ANOVA. Le concept est similaire à la réponse de @amoeba, avec, espérons-le, une illustration plus basique. Supposons qu'un groupe de sujets est réparti au hasard de manière égale en différents groupes et que chaque sujet est mesuré un nombre égal de fois. Il s'agit d'une conception de parcelle divisée avec des sujets comme parcelle entière et des mesures à l'intérieur de chaque sujet comme observations de sous-parcelles. Notons la mesure au k-ème point temporel du j-ème sujet du i-ème groupe,yijk i=1,...,I;j=1,...,J;k=1,...,K.
La moyenne de l'échantillon du i-ème groupe est
et celle du ij-ème sujet est
En supposant l'indépendance parmi les sujets, la variance de la différence entre deux moyennes de groupe est
Il est raisonnable de s'attendre à ce que des mesures répétées chez un sujet soient corrélées. Ainsi, pas aussi simple que avec étant la variance de chaque observation. Quoi qu'il en soit, si Est supposé constant pour tous les sujets, on peut valablement exécuter un test t "simple" à 2 échantillons pour comparer 2 moyennes de groupe. Ainsi, une motivation pour supposer des variances constantes est d'effectuer un test t simple et valide.Var(y¯ij.) σ2/K σ2 Var(y¯ij.)
Passons maintenant à la question de la sphéricité qui a été soulevée.
Il peut être intéressant de comparer les moyennes d'échantillonnage entre deux points temporels quelconques avec , où Cette comparaison nécessite de trouver la variance de la différence par paire entre et pour tous les sujets. Plus précisément, dans l'hypothèse habituelle d'indépendance des sujets,y¯..k−y¯..k′
Par conséquent, en supposant une variance constante de toutes les différences par paires, il est possible d'effectuer un test t une fois que la variance commune est estimée. Cette hypothèse, ainsi que la variance constante de chaque observation, implique que la covariance entre n'importe quelle paire de mesures est constante sur toutes les paires - Sergioa un excellent article sur ce sujet. Les hypothèses rendent donc une structure variance-covariance pour des mesures répétées de chaque sujet sous la forme d'une matrice avec une constante diagonale et une autre constante hors diagonale. Lorsque les entrées hors diagonale sont toutes nulles, cela se réduit au modèle tout indépendant (ce qui pourrait être inapproprié pour de nombreuses études de mesure répétées). Lorsque les entrées hors diagonale sont les mêmes que celles en diagonale, les mesures répétées sont parfaitement corrélées pour un sujet, ce qui signifie que toute mesure unique est aussi bonne que toutes les mesures pour chaque sujet. Remarque finale - lorsque K = 2 dans notre conception de parcelle fractionnée simple, la condition de sphéricité est automatiquement remplie.
la source