Qu'est-ce que la covariance en langage clair?

93

Qu'est-ce que la covariance en langage clair et comment est-elle liée aux termes dépendance , structure de corrélation et structure de variance-covariance en ce qui concerne les plans à mesures répétées?

Stan
la source

Réponses:

82

La covariance est une mesure de la façon dont les changements dans une variable sont associés aux changements dans une seconde variable. Plus précisément, la covariance mesure le degré auquel deux variables sont associées linéairement. Cependant, il est également souvent utilisé de manière informelle comme mesure générale de la relation monotone entre deux variables. Il existe de nombreuses explications intuitives utiles de la covariance ici .

En ce qui concerne la relation entre la covariance et chacun des termes que vous avez mentionnés:

[1,1]±10

00

                entrez la description de l'image ici

0

(3) La structure de variance / covariance (souvent appelée simplement structure de covariance ) dans les conceptions de mesures répétées fait référence à la structure utilisée pour modéliser le fait que les mesures répétées sur des individus sont potentiellement corrélées (et donc sont dépendantes). entrées dans la matrice de covariance des mesures répétées. Un exemple est la structure de corrélation échangeable à variance constante qui spécifie que chaque mesure répétée a la même variance et que toutes les paires de mesures sont corrélées de manière égale. Un meilleur choix peut être de spécifier une structure de covariance qui nécessite deux mesures éloignées dans le temps pour être moins corrélées (par exempleun modèle autorégressif ). Notez que le terme structure de covariance apparaît plus généralement dans de nombreux types d' analyses multivariées où les observations peuvent être corrélées.

Macro
la source
2
ton explication est sympa. Il est suivi d'un supplément précieux qui a provoqué une série de commentaires intéressants. Merci beaucoup à tous :)!
Stan
23

La réponse de Macro est excellente, mais je voudrais ajouter quelque chose sur le lien entre covariance et corrélation. La covariance ne vous dit pas vraiment sur la force de la relation entre les deux variables, contrairement à la corrélation. Par exemple:

x = [1, 2, 3]
y = [4, 6, 10]

cov(x,y) = 2 #I am using population covariance here

Maintenant changeons l'échelle et multiplions x et y par 10

x = [10, 20, 30]
y = [40, 60, 100]

cov(x, y) = 200

Changer l'échelle ne doit pas augmenter la force de la relation. Nous pouvons donc l'ajuster en divisant les covariances par les écarts-types de x et y, ce qui correspond exactement à la définition du coefficient de corrélation.

Dans les deux cas ci-dessus, le coefficient de corrélation entre x et y est 0.98198.

Akavall
la source
6
"La covariance ne vous dit pas vraiment sur la force de la relation entre les deux variables, contrairement à la corrélation." Cette déclaration est complètement fausse. Les deux mesures sont à échelle modulo identique par les deux écarts-types.
David Heffernan
15
@DavidHeffernan, oui, si les écarts-types sont proportionnels, la covariance nous indique la force de la relation. Cependant, la covariance mesurée par elle-même ne nous dit pas cela.
Akavall
10
@ David Heffernan, je pense qu'Akavall dit que si vous ne connaissez pas l'échelle des variables, la covariance ne vous dit rien sur la force de la relation - seul le signe peut être interprété.
Macro
6
Dans quelle situation pratique pouvez-vous obtenir une covariance sans pouvoir également obtenir une bonne estimation de l'échelle des variables?
David Heffernan
7
Cependant, il n’est pas toujours nécessaire de connaître l’écart type pour comprendre l’échelle d’une variable et donc la force d’une relation. Les effets non normalisés sont souvent informatifs. Par exemple, si un cours de formation fait augmenter le revenu de 10 000 dollars par an en moyenne, c'est probablement un meilleur indicateur de la force de l'effet que de dire qu'il y avait une corrélation ar = 0,34 entre le cours et le revenu.
Jeromy Anglim