J'ai trouvé l'explication suivante sur un blog et j'aimerais obtenir plus d'informations sur la non-transitivité de la corrélation:
Nous avons les faits incontestables suivants:
- En moyenne, il existe une différence de volume cérébral entre les hommes et les femmes
- Il existe une corrélation entre le QI et la taille du cerveau; la corrélation est de 0,33 et correspond donc à 10% de la variabilité du QI
De ces prémisses 1 et 2, il semble en découler logiquement: les femmes ont en moyenne un QI inférieur à celui des hommes. Mais c'est une erreur! En statistiques, les corrélations ne sont pas transitives. La preuve est qu'il suffit de regarder les résultats des tests de QI, et ils montrent que le QI des hommes et des femmes ne diffère pas en moyenne.
Je voudrais comprendre cette non-transitivité de la corrélation un peu plus profondément.
Si la corrélation entre le QI et la taille du cerveau était de 0,9 (ce que je sais que ce n'est pas (1)), en déduire que les femmes ont en moyenne un QI inférieur à celui des hommes serait toujours une erreur?
S'il vous plaît, je ne suis pas ici pour parler du QI (et des limites du test), du sexisme, des stéréotypes féminins, de l'arrogance, etc. (2). Je veux juste comprendre le raisonnement logique derrière l'erreur.
(1) ce que je sais que ce n'est pas le cas: les Néandertaliens avaient un cerveau plus gros que l'homo sapiens, mais n'étaient pas plus intelligents;
(2) Je suis une femme et dans l'ensemble, je ne me considère pas, ou les autres femmes moins intelligentes que les hommes, je ne me soucie pas du test de QI, car ce qui compte est la valeur des personnes, et ce n'est pas basé sur le capacités intellectuelles.
La source originale en français:
Sur les faits indiscutables suivants:
- il y a une différence de volume cérébral en moyenne entre hommes et femmes
- il y a une corrélation entre QI et volume cérébral; la corrélation est 0,33 et correspond donc à 10% de la variabilité
De ces prémisses 1 et 2, il semble résulté logiquement que: les femmes ont en moyenne un QI inférieur aux hommes.
Mais c'est une erreur de raisonnement! En statistique, les corrélations ne sont pas transitives. La preuve, c'est que pour avoir le cœur net, il suffit de regarder les résultats des tests de QI, et ceux-ci montrent que les QI des hommes et des femmes ne diffèrent pas en moyenne.
Réponses:
Oui, ce serait toujours une erreur.
Voici une figure très simple montrant quatre situations différentes. Dans chaque cas, les points rouges représentent les femmes, les points bleus représentent les hommes, l'axe horizontal représente la taille du cerveau et l'axe vertical représente le QI. J'ai généré les quatre ensembles de données tels que:
il y a toujours la même différence de taille moyenne du cerveau entre les hommes ( ) et les femmes ( 28 - les unités sont arbitraires). Ce sont des moyennes de population, mais cette différence est suffisamment grande pour être statistiquement significative avec toute taille d'échantillon raisonnable;22 28
il y a toujours une différence nulle dans le QI moyen entre les hommes et les femmes (tous deux ), et aussi une corrélation nulle entre le sexe et le QI;100
la force de corrélation entre la taille du cerveau et le QI varie comme indiqué sur la figure.
Dans la sous-intrigue en haut à gauche, la corrélation intra-sexe (calculée séparément pour les hommes et séparément pour les femmes, puis en moyenne) est de , comme dans votre citation. Dans la sous-placette supérieure droite, la corrélation globale (sur les hommes et les femmes ensemble) est de 0,3 . Notez que votre devis ne précise pas à quoi se réfère le nombre de 0,33 . Dans la sous-intrigue en bas à gauche, la corrélation intra-sexe est de 0,9 , comme dans votre exemple hypothétique; dans la sous-placette inférieure droite, la corrélation globale est de 0,9 .0,3 0,3 0,33 0,9 0,9
Vous pouvez donc avoir n'importe quelle valeur de corrélation, et peu importe qu'elle soit calculée globalement ou au sein d'un groupe. Quel que soit le coefficient de corrélation, il est fort possible qu'il n'y ait aucune corrélation entre le sexe et le QI et aucune différence entre les sexes dans le QI moyen.
Explorer la non-transitivité
Explorons tout l'espace des possibilités, en suivant l'approche suggérée par @kjetil. Supposons que vous ayez trois variables et (sans perte de généralité) supposons que la corrélation entre x 1 et x 2 est a > 0 et la corrélation entre x 2 et x 3 est b > 0 . La question est: quelle est la valeur positive minimale possible de la corrélation λ entre x 1 et x 3X1, x2, x3 X1 X2 a > 0 X2 X3 b > 0 λ X1 X3 ? Est - il parfois avoir à être positif, ou peut - il être toujours égale à zéro?
La matrice de corrélation est et elle doit avoir un déterminant non négatif, c'est-à-dire d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , ce qui signifie que λ doit se situer entre a b ± √
Nous pouvons résoudre ce problème numériquement et tracer la valeur positive minimale possible de pour différents a et b :λ une b
De manière informelle, nous pourrions dire que les corrélations seraient transitives si étant donné que et b > 0 , on pourrait conclure que λ > 0 . Nous voyons que pour la plupart des valeurs a et b , λ peut être nul, ce qui signifie que les corrélations sont non transitives. Cependant, pour certaines valeurs suffisamment élevées de a et b , la corrélation λ doit être positive , ce qui signifie qu'il existe "un certain degré de transitivité" après tout, mais limité à des corrélations très élevées uniquement. Notez que les deux corrélations a et ba > 0 b > 0 λ > 0 une b λ une b λ une b doivent être élevés.
On peut trouver une condition précise pour cette "transitivité": comme mentionné ci-dessus, la plus petite racine doit être positive, c'est -à- dire , ce qui équivaut àa2+b2>1. Ceci est une équation d'un cercle! Et en effet, si vous regardez la figure ci-dessus, vous remarquerez que la région bleue forme un quart de cercle.a b - ( 1 - a2) ( 1 - b2)-------------√> 0 une2+ b2> 1
Dans votre exemple spécifique, la corrélation entre le sexe et la taille du cerveau est assez modérée (peut être a = 0,5 ) et la corrélation entre la taille du cerveau et le QI est b = 0,33 , ce qui est fermement dans la région bleue ( a 2 + b 2 < 1 ), ce qui signifie que λ peut être positif, négatif ou nul.a = 0,5 b = 0,33 une2+ b2< 1 λ
Chiffre pertinent de l'étude originale
Vous vouliez éviter de discuter de genre et de cervelle, mais je ne peux m'empêcher de souligner qu'en regardant la figure complète de l'article original ( Gur et al. 1999 ), on peut voir que s'il n'y a pas de différence de genre dans le score de QI verbal, il y a une différence évidente et significative dans le score de QI spatial! Comparer les sous-parcelles D et F.
la source
Mise à jour:
la source
C'est une situation dans laquelle j'aime utiliser des diagrammes de chemin pour illustrer les effets directs et les effets indirects , et comment ces deux effets sur les corrélations globales.
Selon la description originale, nous avons une matrice de corrélation ci-dessous. La taille du cerveau a une corrélation d'environ 0,3 avec le QI, les femmes et le QI ont une corrélation de 0 entre eux. Je remplis la corrélation négative entre la taille des femmes et celle du cerveau à -0,3 (si je devais deviner que c'est beaucoup plus petit que cela, mais cela servira à des fins d'illustration).
Si nous ajustons un modèle de régression où le QI est fonction de la taille du cerveau et étant une femme, nous pouvons l'illustrer en termes de diagramme de chemin. J'ai rempli les coefficients de régression partielle sur les flèches, et le nœud B représente la taille du cerveau et le nœud F signifie la femelle.
Maintenant, c'est fou - quand on contrôle la taille du cerveau, étant donné ces corrélations, les femmes ont une relation positive avec le QI. Pourquoi cela, alors que la corrélation marginale est nulle? Selon les règles avec les diagrammes de chemin linéaire ( Wright, 1934 ), nous pouvons décomposer la corrélation marginale en fonction de l'effet direct lors du contrôle de la taille du cerveau et de l'effet indirect:
Parce que l'effet total est nul, nous savons que l'effet direct doit simplement être exactement le signe opposé et la taille de l'effet indirect , d'où l'effet direct est égal à 0,099 dans cet exemple. Maintenant, ici, nous avons une situation lors de l'évaluation du QI attendu des femmes, nous obtenons deux réponses différentes, bien que probablement pas ce à quoi vous vous attendiez initialement lors de la spécification de la question. Lorsque vous évaluez simplement le QI marginal attendu des femmes par rapport aux hommes, la différence est nulle telle que vous l'avez définie (en ayant une corrélation nulle). Lors de l'évaluation de la différence attendue en fonction de la taille du cerveau, les femmes ont un QI plus élevé que les hommes.
Vous pouvez insérer dans cet exemple des corrélations plus grandes entre la taille du cerveau et le QI (ou des corrélations plus petites entre la taille des femmes et du cerveau), étant donné les limites que Kjetil montre dans sa réponse. L'augmentation de la première rend l'écart entre le QI conditionnel des femmes et des hommes encore plus favorable aux femmes, la diminution de la seconde réduit les différences.
la source
Notez que tandis que le texte cité parle de "corrélation entre le volume du cerveau et le QI" en général, l'image fournie fait une distinction avec les deux lignes de tendance (c'est-à-dire qu'elle montre séparément la corrélation pour les deux sous-groupes). Nous les considérons donc séparément (ce qui est la bonne façon de procéder).
alors
et
Il faut alors que
et cela
la source