La corrélation n'implique pas de causalité, car il pourrait y avoir de nombreuses explications à la corrélation. Mais la causalité implique-t-elle une corrélation? Intuitivement, je penserais que la présence de causalité signifie qu'il y a nécessairement une corrélation. Mais mon intuition ne m'a pas toujours bien servi en statistiques. La causalité implique-t-elle une corrélation?
correlation
causality
Matthieu
la source
la source
Réponses:
Comme beaucoup de réponses ci-dessus l'ont indiqué, la causalité n'implique pas de corrélation linéaire . Étant donné que bon nombre des concepts de corrélation proviennent de champs qui reposent fortement sur des statistiques linéaires, la corrélation est généralement considérée comme égale à la corrélation linéaire. L' article de Wikipédia est une bonne source pour cela, j'aime beaucoup cette image:
Regardez quelques figures dans la rangée du bas, par exemple la forme parabole du 4ème exemple. C'est un peu ce qui se passe dans la réponse @StasK (avec un peu de bruit ajouté). Y peut être entièrement causé par X mais si la relation numérique n'est pas linéaire et symétrique, vous aurez toujours une corrélation de 0.
Le mot que vous recherchez est une information mutuelle : c'est en quelque sorte la version non linéaire générale de la corrélation. Dans ce cas, votre affirmation serait vraie: la causalité implique une grande information mutuelle .
la source
La réponse stricte est "non, la causalité n'implique pas nécessairement une corrélation".
Considérons et . Lien de causalité ne soit pas plus forte: détermine . Cependant, la corrélation entre et est 0. Démonstration: Les moments (conjoints) de ces variables sont: ; ; utilisant la propriété de la distribution normale standard que ses moments impairs sont tous égaux à zéro (peut être facilement déduite de sa fonction générant les moments, par exemple). Par conséquent, la corrélation est égale à zéro.Y = X 2 ~ χ 2 1 X Y X YX∼N(0,1) Y=X2∼χ21 X Y X Y E[X]=0 E[Y]=E[X2]=1
la source
Essentiellement, oui.
La corrélation n'implique pas la causalité car il pourrait y avoir d'autres explications pour une corrélation au-delà de la cause. Mais pour que A soit une cause de B, ils doivent être associés d’une manière ou d’une autre . Ce qui signifie qu'il existe une corrélation entre eux - bien que cette corrélation ne doive pas nécessairement être linéaire.
Comme certains commentateurs l'ont suggéré, il est probablement plus approprié d'utiliser un terme comme «dépendance» ou «association» plutôt que corrélation. Bien que, comme je l’ai mentionné dans les commentaires, j’ai vu "corrélation ne signifie pas causalité" en réponse à une analyse bien au-delà de la simple corrélation linéaire; association entre A et B.
la source
Ajout à la réponse de @EpiGrad. Je pense que pour beaucoup de gens, "corrélation" impliquera "corrélation linéaire". Et le concept de corrélation non linéaire pourrait ne pas être intuitif.
Donc, je dirais "non, ils ne doivent pas être corrélés mais ils doivent être liés ". Nous sommes d’accord sur le fond, mais pas sur la meilleure façon de le faire passer.
Un exemple d'une telle cause (du moins les gens pensent qu'elle est causale) est celui qui existe entre la probabilité de répondre à votre téléphone et le revenu. On sait que les personnes aux deux extrémités du spectre des revenus sont moins susceptibles de répondre au téléphone que les personnes du milieu. On pense que le modèle de causalité est différent pour les pauvres (par exemple, éviter les collecteurs de factures) et les riches (par exemple, éviter que les gens demandent des dons).
la source
Considérez le modèle causal suivant:
Maintenant, laisse:
En bref, je dirais que: (i) la causalité suggère la dépendance; mais, (ii) la dépendance est une dépendance fonctionnelle / structurelle et peut ou non se traduire par la dépendance statistique spécifique à laquelle vous songez.
la source
La cause et l'effet seront corrélées à moins qu'il n'y a pas de variation du tout de l'incidence et de l' ampleur de la cause et aucune variation du tout dans sa force de cause à effet. La seule autre possibilité serait que la cause soit parfaitement corrélée à une autre variable causale ayant exactement l'effet inverse. Fondamentalement, ce sont des conditions expérimentales. Dans le monde réel, la causalité impliquera une dépendance sous une forme ou une autre (bien que cela puisse ne pas être une corrélation linéaire ).
la source
Il y a d'excellentes réponses ici. Artem Kaznatcheev , Fomite et Peter Flom soulignent que la causalité impliquerait généralement une dépendance plutôt qu'une corrélation linéaire. Carlos Cinelli donne un exemple où il n'y a pas de dépendance, à cause de la manière dont la fonction génératrice est configurée.
Je voudrais ajouter un point sur la façon dont cette dépendance peut disparaître dans la pratique, dans les types de jeux de données avec lesquels vous pourriez bien travailler. Des situations comme celle de Carlos ne se limitent pas à de "simples conditions d’expérience".
Les dépendances disparaissent dans les processus d'autorégulation . L'homéostasie, par exemple, garantit que la température interne de votre corps reste indépendante de la température ambiante. La chaleur externe influe directement sur la température de votre corps, mais également sur les systèmes de refroidissement du corps (par exemple, la transpiration) qui maintiennent la température du corps stable. Si nous échantillonnons la température à des intervalles extrêmement rapides et en utilisant des mesures extrêmement précises, nous aurons une chance d’observer les dépendances de cause à effet, mais à des taux d’échantillonnage normaux, la température corporelle et la température externe apparaissent indépendantes.
Les processus autorégulateurs sont courants dans les systèmes biologiques; ils sont produits par l'évolution. Les mammifères qui ne régulent pas leur température corporelle sont éliminés par sélection naturelle. Les chercheurs qui travaillent avec des données biologiques doivent savoir que des dépendances de cause à effet peuvent disparaître de leurs jeux de données.
la source
Une cause sans corrélation ne serait-elle pas un rng?
À moins que, comme le suggère la réponse acceptée, vous utilisiez une interprétation incroyablement limitée du mot "corrélation", il s'agit d'une question idiote: si une chose en "cause" une autre, elle est par définition affectée d'une manière ou d'une autre, qu'il s'agisse d'un augmentation de la population, ou juste intensité.
droite?
Là encore, vous pourriez discuter de quelque chose de plus semblable à, la visibilité de quelque chose qui est affecté par quelque chose d'autre, ce qui, je suppose, ressemblerait à une causalité, mais en réalité vous ne mesurez pas ce que vous pensez que vous mesurez ...
Alors oui, je suppose que la réponse courte serait: "Oui, tant que vous ne pouvez pas créer d'entropie."
la source