Quelqu'un a-t-il une idée de la raison pour laquelle la corrélation conditionnelle entre 2 variables est appelée corrélation "partielle" et la corrélation simple entre elles (donc, lorsqu'elle n'est conditionnée à aucune autre variable) est appelée corrélation "marginale"? Quelle est l'intuition derrière les mots "partiel" et "marginal"? Que font-ils des "pièces" ou des "marges"?
Il serait bon d'apprendre la réponse afin de mieux comprendre ces concepts.
Réponses:
Le terme "marginal" est très ancien. Si vous remontez assez loin dans l'histoire, il n'y avait pas de revues scientifiques (évidemment elles ont commencé vers 1665 ). Au lieu de cela, les résultats intermédiaires ont été communiqués par lettres manuscrites et les résultats finaux ont été écrits dans des livres. Il n'y avait pas grand-chose de graphique de données avant Playfair , mais les livres pouvaient souvent avoir des tableaux avec des nombres dans des conditions différentes. Considérez ce tableau:
Ces valeurs sont toutesconditionnelles; c'est-à-dire qu'ils donnent un nombre pour une combinaison spécifique de conditions. Cependant, les lecteurs voulaient parfois savoir à quoi ressemblait une condition particulière sans tenir compte de l'autre variable. ImaginezxI,Aest le nombre de fois où quelque chose s'est produit lorsque la première variable étaitI
Qu'est-ce que ces chiffres ont à voir avec les corrélations? Eh bien, ce n'est pas une connexion directe, mais une fois que vous avez l'idée de «ne pas tenir compte des autres variables», et que vous avez un nom pour cela («marginal»), lorsqu'un nouveau contexte apparaît qui est analogue (c.-à-d., Corrélations) , le nom et l'idée sont simplement appliqués.
Je ne connais pas l'étymologie des corrélations partielles, mais je peux vous donner l'intuition. C'est assez simple, vraiment: vous avez affaire à la corrélation entre une partie d'une variable et une partie d'une autre. Considérez cette figure:
On peut imaginer le cercle gauche est une variable , le cercle droit est une variable Y , et le cercle supérieur est une variable Z . La corrélation entre deux variables est liée au degré de chevauchement des cercles (en fait, nous pouvons imaginer que l'aire des cercles représente la variabilité de chaque variable et que le pourcentage de l'aire est r 2 ). Maintenant , il est clair qu'il existe une certaine corrélation entre X et Y , mais il y a aussi une certaine corrélation entre X et Z , et entre Y et Z . Et si vous vouliez savoir quelle était la corrélation entre ces parties deX Oui Z r2 X Oui X Z Oui Z et Y qui n'étaient pas liés à ZX Oui Z ? Ce serait lacorrélation partielle. Il est lié au chevauchement entre les deuxpartiesdes cercles qui n'incluent pas les éclats supérieurs qui coupent le cercle supérieur.
J'aime cette page Web pour fournir une discussion facile à comprendre sur les corrélations partielles et les sujets connexes. Seule la première section concerne les corrélations partielles en soi, mais je recommande fortement de lire la page entière (même si elle est plutôt longue). Bien que n'étant pas directement liés, la discussion à ce fil: Où est la variance partagée entre tous les IV dans une équation de régression multiple linéaire? , peut également être utile.
la source
Pour illustrer les propriétés issues de cette définition, nous pouvons considérer deux cas limites:
la source