Tout d’abord, j’apprécie que les discussions sur provoquent généralement des explications sur (c.-à-d. le coefficient de détermination en régression). Le problème auquel je cherche à répondre est de généraliser cela à toutes les instances de corrélation entre deux variables.
Donc, je suis perplexe sur la variance partagée depuis un bon moment. J'ai eu quelques explications, mais elles semblent toutes problématiques:
C'est juste un autre terme pour covariance. Cela ne peut pas être le cas, car la littérature sur l'analyse factorielle fait la différence entre l'ACP et l'EPT en déclarant que ce dernier explique la variance partagée et le premier ne le fait pas (l'APC tient évidemment compte de la covariance en ce qu'elle opère sur une matrice de covariance, donc partagée la variance doit être un concept distinct).
Il s'agit du coefficient de corrélation au carré (). Voir:
Cela a un peu plus de sens. Le problème ici est d'interpréter comment cela implique qu'il s'agit d'une variance partagée. Par exemple, une interprétation de la «variance de partage» est. ne se réduit pas à cela, ni même à un concept facilement intuitif [; qui est un objet à 4 dimensions].
Les liens ci-dessus tentent tous deux de l'expliquer via un diagramme Ballentine. Ils n'aident pas. Premièrement, les cercles sont de taille égale (ce qui semble être important pour l'illustration pour une raison quelconque), ce qui ne tient pas compte des écarts inégaux. On pourrait supposer que ce sont les diagrammes de Ballentine pour les variables standardisées, donc la variance égale, auquel cas le segment qui se chevauchent expliquerait la covariance entre deux variables standardisées (la corrélation). Donc, ne pas .
TL; DR: Les explications de la variance partagée disent ceci:
En quadrillant le coefficient, vous savez combien de variance, en pourcentage, les deux variables partagent.
Pourquoi en serait-il ainsi?
la source
Réponses:
On ne peut que deviner ce que pourrait signifier un auteur en particulier par «variance partagée». Nous pourrions espérer circonscrire les possibilités en considérant quelles propriétés ce concept devrait (intuitivement) avoir. On sait que "les variances s'ajoutent": la variance d'une sommeX+ε est la somme des variances de X et ε quand X et ε ont une covariance nulle. Il est naturel de définir la "variance partagée" desX la somme étant la fraction de la variance de la somme représentée par la variance de X . Cela suffit pour impliquer les écarts de partage des deux variables aléatoiresX et Y doit être le carré de leur coefficient de corrélation.
Ce résultat donne un sens à l'interprétation d'un coefficient de corrélation au carré comme une "variance partagée": dans un sens approprié, c'est vraiment une fraction d'une variance totale qui peut être affectée à une variable de la somme.
Les détails suivent.
Principes et leurs implications
Bien sûr siY=X , leur "variance partagée" (appelons-la désormais "SV") devrait être de 100%. Mais siY et X sont juste des versions échelonnées ou décalées les unes des autres? Par exemple, siY représente la température d'une ville en degrés F et X représente la température en degrés C? Je voudrais suggérer que dans de tels casX et Y devrait toujours avoir 100% SV, de sorte que ce concept restera significatif quelle que soit la façon dont X et Y pourrait être mesurée:
pour tous les nombresα,γ et des nombres non nuls β,δ .
Un autre principe pourrait être que lorsqueε est une variable aléatoire indépendante de X , alors la variance de X+ε peut être décomposé de façon unique en deux parties non négatives,
suggérant que nous essayons de définir SV dans ce cas spécial comme
Étant donné que tous ces critères ne sont que du second ordre - ils ne concernent que les premier et deuxième moments des variables sous la forme d'attentes et de variances - assouplissons l'exigence selon laquelleX et ε être indépendant et exiger seulement qu'ils ne soient pas corrélés . Cela rendra l'analyse beaucoup plus générale qu'elle ne le serait autrement.
Les resultats
Ces principes - si vous les acceptez - conduisent à un concept unique, familier et interprétable. L'astuce sera de réduire le cas général au cas particulier d'une somme, où l'on pourra appliquer la définition(2) .
Donné(X,Y) , nous essayons simplement de décomposer Y dans une version évoluée et décalée de X plus une variable qui n'est pas corrélée avec X : c'est-à-dire, trouvons (si c'est possible) des constantes α et β et une variable aléatoire ϵ Pour qui
avecCov(X,ε)=0 . Pour que la décomposition ait une chance d'être unique, nous devons exiger
pour qu'une foisβ est trouvé, α est déterminé par
Cela ressemble énormément à une régression linéaire et c'est effectivement le cas. Le premier principe dit que nous pouvons redimensionnerX et Y avoir une variance unitaire (en supposant qu'ils ont chacun une variance non nulle) et que lorsque cela est fait, les résultats de régression standard affirment la valeur de β dans (3) est la corrélation de X et Y :
De plus, en prenant les variances de(1) donne
impliquant
par conséquent
Notez que parce que le coefficient de régression surY (lorsqu'il est normalisé en fonction de la variance unitaire) est ρ(Y,X)=ρ(X,Y) , la "variance partagée" elle-même est symétrique, justifiant une terminologie qui suggère l'ordre de X et Y n'a pas d'importance:
la source