Comment tester si une matrice de covariance a changé sur deux points dans le temps?

13

Ma tâche consiste à tester s'il y a un changement dans la matrice de covariance de 6 variables. Les valeurs de 6 variables sont mesurées deux fois chez les mêmes sujets (3 ans entre les mesures).

Comment puis je faire ça? J'ai fait la plupart de mon travail en utilisant SAS.

Janne
la source
Merci pour vos réponses. Je pensais à la case M, mais je ne savais pas si elle s'appliquait aux mesures répétées. Je devais prendre le livre de Rencher. Je suis tout à fait certain que la comparaison de modèles imbriqués peut également être utilisée, par exemple, un mélange de proc de SAS. Merci quand même! Je suis nouveau ici et j'espère pouvoir un jour fournir des réponses: o)
Janne
Bienvenue sur le site! Merci sont les bienvenus mais sur ce site vous ne devez pas leur donner de réponse. Vous pouvez exprimer votre gratitude en votant pour les réponses que vous aimez et en acceptant celle que vous aimez le plus. Vous pouvez également ajouter un commentaire à la réponse. Il est également utile que vous posiez dans la question les choses que vous avez essayées ou pensez pouvoir aider à résoudre le problème.
mpiktas

Réponses:

11

En supposant que vos distributions sont normales multivariées (comme les tests des matrices de covariance ont tendance à supposer que, de toute façon), votre hypothèse nulle est que les deux populations ne diffèrent que par décalage. Vous pouvez le tester avec un test de Kolmogorov-Smirnov sur les deux groupes de données dont leurs moyennes ont été soustraites.

Rencher (2002) (section 7.3.2) fournit la statistique de test du rapport de vraisemblance pour comparer deux matrices (encadré M-test) comme suit:

M=|S1|ν1/2|S2|ν2/2/|Sp|(ν1+ν2)/2

où et sont les matrices de covariance de l'échantillon dans les deux échantillons, est la matrice de covariance regroupée, et sont les degrés de liberté (taille de l'échantillon moins 1). De manière asymptotique, suit la avec degrés de liberté où est la taille des matrices. Rencher (2002) donne également la version corrigée de Bartlett du test et une approximationCependant, il s'agit d'un test à deux échantillons plutôt que du test de mesures répétées, il peut donc être quelque peu conservateur.S 2 S p ν 1 ν 2 - 2 log M χ 2 p ( p + 1 ) / 2 p FS1S2Spν1ν22logMχ2p(p+1)/2pF

StasK
la source
Quelle est une alternative au test M de Box pour l'homogénéité des matrices de covariance si les distributions ne sont pas multivariées normales?
Nick
Je dirais que c'est inapplicable. Tout doit être normal pour que les ratios de vraisemblance s'appliquent. Sinon, vous devrez vous tourner vers des statistiques basées sur les moments, puis vous aurez besoin de moments de quatrième ordre pour obtenir des covariances de covariances.
StasK
8

Vous pouvez utiliser un logiciel de modélisation d'équations structurelles. Voici un aperçu du fonctionnement du processus à Amos:

  • Ajoutez toutes vos variables pour le temps 1 ( ) et le temps 2 ( )Y 1 , . . . , Y 6X1,...,X6Y1,...,Y6
  • Dessinez des flèches à double tête entre toutes les variables (c.-à-d. Que vous faites savoir au logiciel que toutes les variances et covariances sont libres de varier, et donc, votre modèle devrait parfaitement représenter les données)
  • Nommez toutes les variances et covariances
  • Ce qui précède est le modèle 1 (c.-à-d., Aucune contrainte d'égalité)
  • Ajoutez ensuite des énoncés d'égalité au modèle 2 (c.-à-d. Variances et covariances contraintes)
    • Variances égales pour les variables correspondantes à différents moments: par exemple, var_x1 = var_y1 var_x2 = var_y2etc.
    • covariances égales pour les points de temps correspondants: par exemple, cov_x1_x2 = cov_y1_y2 cov_x1_x3 = cov_y1_y3etc.
  • Examiner la différence d'ajustement entre les deux modèles
    • le modèle 2 est imbriqué dans le modèle 1, vous devriez donc être en mesure d'utiliser des tests de comparaison de modèles imbriqués comme les tests de différence khi-deux.
Jeromy Anglim
la source
2

Cela peut probablement être testé avec proc mixed (eh bien, vous devez supposer une normalité multivariée). Empilez toutes les données sur une seule colonne. Vous aurez alors besoin d'indicateurs pour l'ID du sujet et pour le point temporel. Vous devrez définir à la fois l'ID du sujet et l'indicateur de point de temps comme variables de classe. Ajuster un modèle d'interception uniquement; puis utilisez peut-être une déclaration répétée pour ajuster une structure de variance / covariance non contrainte ( type=un). Notez le où est la probabilité) et les degrés de liberté. Ajustez ensuite un deuxième modèle, mais cette fois dans l'instruction répétée, utilisez l' option pour adapter les structures de covariance distinctes pour chaque point dans le temps (c'est-à-dire que chaque point dans le temps est un groupe). Notez leL - 2 ln ( L )2ln(L)Lgroup=SAS2ln(L)et df. Ensuite, effectuez le test LRT de pas de différence d'ajustement en utilisant la différence de -2loglikelihoods et dfs entre les deux modèles, qui devraient être distribués en chi carré sous l'hypothèse nulle de pas de différence d'ajustement entre les deux modèles.

Andres
la source
Bienvenue sur le site, @Andres. Vous pouvez utiliser LaTeX ici. Je l'ai fait dans votre message pour le rendre un peu plus net.
Peter Flom - Réintègre Monica