Covariance et indépendance?

54

J'ai lu dans mon manuel que ne garantit pas que X et Y sont indépendants. Mais si elles sont indépendantes, leur covariance doit être égale à 0. Je ne peux encore penser à aucun exemple approprié; quelqu'un pourrait-il en fournir un?cov(X,Y)=0

Cochon volant
la source
10
Vous pouvez également apprécier un rapide examen du Quatuor d' Anscombe , qui illustre certaines des nombreuses façons différentes dont une covariance non nulle peut être réalisée par un jeu de données bivarié.
whuber
7
La chose à noter est que la mesure de la covariance est une mesure de la linéarité. Le calcul de la covariance revient à répondre à la question «Les données forment-elles un motif de ligne droite? Si les données suivent un modèle linéaire, elles sont donc dépendantes. MAIS, ce n’est qu’un des moyens par lesquels les données peuvent être dépendantes. C'est comme demander: "Est-ce que je conduis imprudemment?" Une question pourrait être "Est-ce que vous dépassez la vitesse maximale de 25 mi / h?" Mais ce n'est pas le seul moyen de conduire de manière imprudente. Une autre question pourrait être "Es-tu saoul?" etc. Il y a plus d'une façon de conduire imprudemment.
Adam
La soi-disant mesure de la linéarité donne une structure à la relation. Ce qui est important, c'est que la relation puisse être non linéaire, ce qui n'est pas rare. En règle générale, la covariance n'est pas nulle, c'est hypothétique.La covariance indique la magnitude et non un ratio,
Subhash C. Davar

Réponses:

48

Exemple simple: Soit une variable aléatoire égale à ou avec une probabilité de 0,5. Soit alors une variable aléatoire telle que si et est aléatoire ou avec une probabilité de 0,5 si .- 1 + 1 Y Y = 0 X = - 1 Y - 1 + 1 X = 1X1+1YY=0X=1Y1+1X=1

Clairement, et sont fortement dépendants (puisque connaître me permet de parfaitement connaître ), mais leur covariance est nulle: ils ont tous les deux une moyenne nulle, etY Y XXYYX

E[XY]=(1)0P(X=1)+11P(X=1,Y=1)+1(1)P(X=1,Y=1)=0.

Ou plus généralement, prenons toute distribution et tout tels que pour tout (c'est-à-dire une distribution jointe qui est symétrique autour de l’ axe des ) et vous aurez toujours une covariance nulle. Mais vous aurez une non-indépendance à chaque fois que ; c'est-à-dire que les conditionnels ne sont pas tous égaux au marginal. Ou idem pour la symétrie autour de l' axe des .P ( Y | X ) P ( Y = a | X ) = P ( Y = - a | X ) X x P ( Y | X ) P ( Y ) yP(X)P(Y|X)P(Y=a|X)=P(Y=a|X)XxP(Y|X)P(Y)y

jpillow
la source
32

Voici l'exemple que je donne toujours aux étudiants. Prenez une variable aléatoire avec et , par exemple une variable aléatoire normale avec une moyenne nulle. Prenez . Il est clair que et sont liés, maisXEX=0EX3=0Y=X2XY

cov(X,Y)=EXYEXEY=EX3=0.
mpiktas
la source
J'aime cet exemple aussi. Dans un cas particulier, une va (0,1) et une va2 (1) ne sont pas corrélées.
ocram
3
+1 mais en tant que joueur mineur, vous devez supposer que séparément (cela ne découle pas de l'hypothèse de symétrie de la distribution ou de ), de sorte que Vous ne rencontrerez pas de problèmes tels que sous la forme . Et j’ai des doutes quant à l’affirmation de @ ocram selon laquelle " une va (N) (0,1) et une va2 (1) ne sont pas corrélées". (souligné) Oui, et ne sont pas corrélés, mais pas tout et variables aléatoires . E [ X ] = 0 E [ X 3 ] - X ~ N ( 0 , 1 ) X 2 ~ χ 2 ( 1 ) N ( 0 , 1 ) χ 2 ( 1 )E[X3]=0E[X]=0E[X3]XN(0,1)X2χ2(1) N(0,1)χ2(1)
Dilip Sarwate
@DilipSarwate, merci, j'ai modifié ma réponse en conséquence. Quand je l'ai écrit, je pensais aux variables normales. Pour elles, zéro troisième moment découle de la moyenne zéro.
Mpiktas
19

L'image ci-dessous (source Wikipedia ) contient un certain nombre d'exemples sur la troisième ligne, en particulier les premier et quatrième exemples ont une relation de dépendance forte, mais une corrélation 0 (et une covariance 0).

entrez la description de l'image ici

rien101
la source
15

Quelques autres exemples, considérons les points de données qui forment un cercle ou une ellipse, la covariance est 0, mais sachant que x vous réduisez y à 2 valeurs. Ou des données dans un carré ou un rectangle. De plus, les données qui forment un X ou un V ou un ^ ou <ou> donneront toutes une covariance 0, mais ne seront pas indépendantes. Si y = sin (x) (ou cos) et x couvre un multiple entier de périodes, alors cov sera égal à 0, mais connaissant x, vous savez y ou au moins | y | dans les cas d'ellipse, x, <et>.

Greg Snow
la source
1
Que if devrait être "si x couvre un multiple entier de périodes commençant par un pic ou un creux", ou plus généralement: "Si x couvre un intervalle sur lequel y est symétrique"
naught101
Pourriez-vous expliquer pourquoi la covariance est égale à zéro pour un cercle?
user1993
1
@ user1993, Regardez la formule de covariance (ou corrélation). Ensuite, pensez au cercle / ellipse. En soustrayant les moyennes, on obtient un cercle centré sur (0,0). Ainsi, pour chaque point du cercle, vous pouvez refléter le point autour de l'axe des x, des y et des deux axes pour trouver 4 points au total. contribuer exactement la même valeur absolue à la covariance, mais 2 seront positifs et 2 seront négatifs donnant une somme de 0. Faites ceci pour tous les points d'un cercle et vous additionnerez un groupe de 0 donnant une covariance totale. de 0.
Greg Snow