Exemples concrets de différence entre indépendance et corrélation

9

Il est bien connu que l'indépendance des variables aléatoires implique une corrélation nulle, mais une corrélation nulle n'implique pas nécessairement l'indépendance.

Je suis tombé sur de nombreux exemples mathématiques démontrant la dépendance malgré une corrélation nulle. Existe-t-il des exemples concrets pour soutenir ce fait?

utilisateur46697
la source
2
Attention, seule une corrélation nulle et des variables conjointement normales impliquent l'indépendance.
Francis
2
@Siddesh "Mais comme le volume n'est pas une fonction linéaire de la longueur, ils ne sont pas corrélés." Eh bien, pas parfaitement corrélé. Mais ils seraient positivement corrélés.
Silverfish
1
@Siddhesh: cela ne fonctionnera que si ...E[length4]E[length]E[length3]=0
Francis
1
N'hésitez pas à remettre le commentaire sur la distribution normale si vous n'êtes pas d'accord avec ma modification. Mais je pensais qu'il serait préférable de le supprimer car (1) c'est un problème secondaire gênant pour votre question principale, (2) il a (je pense) déjà été posé sur CV avant, donc ce serait un double du matériel existant ici, ( 3) Je ne voulais pas que cela crée de la confusion chez les futurs lecteurs. J'ai essayé de modifier la question de manière à augmenter ses chances de réouverture: je pense que cette question est assez distincte de celle des "statistiques mathématiques" sur le même sujet.
Silverfish
2
Je pense toujours que cette question est vraiment agréable et pourrait attirer d'autres réponses intéressantes si elle pouvait être rouverte (ce qui pourrait impliquer une modification pour la distinguer clairement du fil dont elle est actuellement considérée comme un doublon). J'ai soulevé un sujet sur Meta sur ce qu'il faudrait pour que cette question soit rouverte. Tous les commentaires sont les bienvenus.
Silverfish

Réponses:

6

Les rendements boursiers sont un exemple décent de la vie réelle de ce que vous demandez. Il y a une corrélation très proche de zéro entre le rendement du S&P 500 d'aujourd'hui et d'hier. Cependant, il existe une dépendance claire: les rendements au carré sont positivement autocorrélés; les périodes de forte volatilité sont regroupées dans le temps.

Code R:

library(ggplot2)
library(grid)
library(quantmod)

symbols   <- new.env()
date_from <- as.Date("1960-01-01")
date_to   <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to)  # S&P500

df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
                 date=index(symbols$GSPC))
df$log_return     <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))

cor(df$log_return,   df$log_return_lag,   use="pairwise.complete.obs")  # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs")  # 0.14

acf(df$log_return,     na.action=na.pass)  # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass)  # Squared returns positively autocorrelated

p <- (ggplot(df, aes(x=date, y=log_return)) +
      geom_point(alpha=0.5) +
      theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)

La série chronologique des retours de journaux sur le S&P 500:

journal des séries temporelles de retour

Si les retours étaient indépendants dans le temps (et stationnaires), il serait très peu probable de voir ces modèles de volatilité groupée, et vous ne verriez pas d'autocorrélation dans les retours de log au carré.

Adrian
la source
3

Un autre exemple est la relation entre le stress et les notes à un examen. La relation est une forme en U inverse et la corrélation est très faible même si la causalité semble assez claire.

Peter Flom
la source
2
Voilà un bel exemple. Avez-vous des données ou simplement basées sur une expérience d'introspection / d'enseignement?
Adrian
1
J'ai vu une étude de cela, mais je l'ai vue il y a de nombreuses années, donc je n'ai pas la citation ou les données réelles.
Peter Flom