Corrélation = 0.2 signifie-t-il qu'il existe une association «chez seulement 1 personne sur 5»?

48

Dans le cerveau idiot: un neuroscientifique explique ce que fait réellement votre tête , a écrit Dean Burnett

La corrélation entre la hauteur et l’intelligence est habituellement de , ce qui signifie que la hauteur et l’intelligence ne semblent être associées que chez 1 personne sur 5 .0.215

Cela me semble faux: je comprends mieux la corrélation que l'erreur (d'erreur) que nous obtenons lorsque nous essayons de prédire une mesure (ici l'intelligence) si la seule chose que nous savons sur cette personne est l'autre mesure (ici la hauteur). Si la corrélation est ou - 1 , alors nous ne faisons aucune erreur dans notre prédiction, si la corrélation est 0,8 , alors il y a plus d'erreur. Ainsi, la corrélation s’appliquerait à n’importe qui, pas seulement à 1 personne sur 5 .110.815

J'ai regardé cette question mais je ne suis pas assez bon en maths pour comprendre la réponse. Cette réponse qui parle de la force de la relation linéaire semble correspondre à ce que je comprends mais je ne suis pas sûre.

Sitak
la source
6
@ JamesPhillips, vous parlez de , pas de r lui-même. Si r = 0,2 alors r 2 = 0,04 soit 4%. r2rr=0.2r2=0.04
Richard Hardy
4
4% est beaucoup plus logique que 20%, merci pour la correction, je suis d'accord avec vous.
James Phillips
29
Cet échantillon de ce livre à 0,01% me fait me demander quelle absurdité se trouve dans le reste ...
Nick Cox
11
J'ai préféré ce billet parce que c'est précisément le genre de question extrêmement simple qui, posée à un étudiant de stats 001 (ou à tout autre néophyte, ou à un candidat à un poste) déterminera immédiatement et sans équivoque s'ils comprennent la signification de la corrélation.
whuber
4
J'arrêterais de lire ce livre, maintenant
PhD

Réponses:

69

Le passage cité est en effet incorrect. Un coefficient de corrélation quantifie le degré d'association au sein d'une population entière (ou d'un échantillon, dans le cas du coefficient de corrélation d'un échantillon). Il ne divise pas la population en parties, une partie montrant une association et l'autre pas. Il se peut que la population se compose en réalité de deux sous-populations avec différents degrés d’association, mais un coefficient de corrélation seul ne l’implique pas.

Kodiologue
la source
19
De plus, même dans une population où 20% des personnes présentaient une corrélation parfaite entre hauteur et intelligence et où 80% indiquaient une corrélation nulle, la corrélation à l'échelle de la population n'est pas nécessairement de 0,2. La déclaration est fausse de plusieurs manières!
Nucléaire Wang
Des choses étranges se produisent avec les threads qui entrent dans la liste Hot Network. Cette réponse est évidemment correcte et correcte ... mais 57 votes positifs?! :-)
amibe dit de réintégrer Monica
2
@ amoeba Si vous pensez que c'est sauvage, consultez ma réponse la plus performante .
Kodiologist
Haha, tu es le maître!
amibe dit de réintégrer Monica le
Est-ce que cela compte comme un trolling à +1 quelque chose juste pour renforcer l'étrangeté qui est SE?
Nat
18

Non, 0,2 ne signifie pas que 1 personne sur 5 montre une corrélation. Je ne sais pas comment il pourrait écrire ce non-sens.

Voici la source du numéro 0.2: "Sur les sources de la corrélation hauteur – intelligence: nouvelles informations à partir d'un modèle ACE à deux variables avec correspondance de l'assortiment", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ Apparemment, la corrélation est robuste.

Je le savais déjà: mon QI a augmenté considérablement avec ma taille à mesure que je grandissais. Maintenant, je sais pourquoi je ne suis plus intelligent: ma taille est stable.

C'était une blague, bien sûr, mais il soulève le problème avec l'argument de l'auteur de ce livre "Idiot": personne ne mesure dans la corrélation sujet-taille entre la taille et le QI, du moins autant que je sache. Je ne sais pas comment vous le feriez proprement, il y aurait tellement de confusion.

Cela dit, les chercheurs utilisent des astuces telles que l'observation au sein de jumeaux et au sein de la famille, des corrélations de taille et de QI, ce qui les aide à résoudre des problèmes confondants. Vraisemblablement, les jumeaux grandissent dans un environnement similaire et ont le même ADN. Par conséquent, dans les études d'observation, il est utile de traiter l'endogénéité et d'autres problèmes. Cependant, si vous mettez tout cela de côté, le résultat final est que la "corrélation 0.2" ne donne aucune raison de dire un non-sens, comme chez certaines personnes, il existe une corrélation et chez d'autres, aucune. C'est juste une interprétation ridicule des résultats d'une étude de corrélation.

Aksakal
la source
8
-1: Bien que je comprenne l'esprit du dernier paragraphe de cette réponse, je pense que cela augmente la confusion, car il introduit inutilement le concept de causalité (le whyici n'est pas pertinent).
Jorge Leitao
1
Vous devez être la personne sur cinq pour laquelle il existe une corrélation.
Carsten S
@ JorgeLeitão Bien sûr que non, aucune causalité n'est impliquée, ils ont grandi ensemble, c'est corrélationnel! :)
Firebug
@ JorgeLeitão, si quelque chose de NN montre que la taille compte. Un cerveau et un échantillon plus gros. Donc, lorsque nous grandissons, notre cerveau augmente et que nous gérons davantage de matériel, nous devons donc devenir plus intelligents. En outre, les hommes sont plus grands que les femmes en moyenne et doivent donc être plus intelligents, en moyenne.
Aksakal
Hah, quel tas de bêtises.
Courses de légèreté avec Monica
8

L'ironie dans la déclaration est presque trop épaisse pour être analysée. Étant donné le titre du texte, je suppose qu’un caractère ironique était prévu. Cependant, votre "instinct" en disant que cela est faux est probablement sur la bonne voie, si l'intuition compte pour quelque chose. Malheureusement, beaucoup de rapports scientifiques échappent à l'intuition lorsqu'il s'agit de concepts que nous n'avons pas rencontrés.

XYXYXY

Ce qui précède n’est qu’une interprétation possible d’une corrélation de 0,2; il est extrêmement tiré par les cheveux parce que très peu de choses dans la vie ont une corrélation de 1 ou 0, et que moins de choses ont encore une modification d'effet assez forte pour produire de telles corrélations.

AdamO
la source
1
"Il est possible que, lors de la mesure d'une association entre X et Y, la corrélation entre X et Y soit égale à 1,0 dans 20% de la population et à 0 dans les 80% restants." - dans l'étude que j'ai publiée, ils ont examiné les corrélations au sein de la famille et entre les jumeaux, elles sont différentes de la population globale. Cependant, je suis sûr que ce n'est pas ce que l'auteur voulait dire, mais comment il interprète le problème en corrélation
Aksakal
@Aksakal, il est intéressant de noter que ces méthodes de composantes de la variance sont destinées à estimer la même corrélation au niveau de la population que celle qui serait mesurée dans une population; elles prétendent simplement utiliser l'héritabilité pour "atténuer" la variance phénotypique imputable à l'influence actuelle de l'environnement (la composante E de l'ACE). modèle): source importante de confusion dans l’hypothèse considérée.
AdamO
10
Si la corrélation est de 1 sur 20% de la population et de 0 à 80%, il ne s'ensuit pas que globalement, elle est de 0,2. Dépend de la variance relative dans chaque sous-population.
amibe dit de réintégrer Monica
1
@ amoeba oui, bon point, souligne encore ce qu'un scénario idiopathique justifierait une telle affirmation.
AdamO
4
"Je suppose que quelque chose qui va comme un fou a été prévu." Vous êtes plus charitable que moi. C'est tout simplement faux. Je ne vois aucune raison de penser que l'auteur s'était intentionnellement trompé d'une manière supposée être intelligente. L’interprétation la plus charitable est que l’auteur a voulu souligner la nature probabiliste d’une corrélation et a choisi sans le vouloir une mauvaise façon de l’illustrer, une façon dont l’auteur serait probablement d’accord pour dire que cela n’a pas vraiment de sens si on le lui indiquait.
John Coleman
2

Il serait difficile d’en arriver à une interprétation significative, et encore moins correcte. L'association n'est pas une propriété de points de données individuels. Si vous aviez juste la hauteur et l'intelligence d'une personne, comment pourriez-vous dire si hauteur et intelligence sont associées? Je suppose que si nous avions le moyen de hauteur et d’intelligence, nous pourrions dire que tout le monde au-dessus de la moyenne dans les deux, ou en dessous de la moyenne dans les deux, montre une "association". Mais si vous aviez des données complètement aléatoires (pas de corrélation), vous devriez vous attendre à ce que la moitié des personnes montre une "association" dans ce sens. J'ai généré un ensemble de données aléatoires avec une corrélation autour de 0,2 (en fait, 22) et j'ai découvert que 55 montraient une "association" dans ce sens.

Il est possible que Y soit une fonction croissante de X et que la corrélation entre eux ne soit que de 0,5; il serait stupide de dire que seulement la moitié des gens montrent une association si chaque personne a une intelligence supérieure à celle de toutes les personnes plus courtes et une intelligence inférieure à celle de toutes les personnes plus grandes. De plus, il est théoriquement possible d'avoir une valeur aberrante créant toute la corrélation, et la corrélation de l'ensemble sans ce point soit égale à zéro. Il est même possible que 20% de la population ait une corrélation négative et que les 80% restants aient également une corrélation négative. La corrélation totale étant alors égale à 0,2.

Accumulation
la source