C'est peut-être une question fondamentale, mais je me demandais pourquoi une valeur dans un modèle de régression peut simplement être mise au carré pour donner un chiffre de variance expliquée?
Je comprends que le coefficient peut donner la force d'une relation, mais je ne comprends pas comment la simple mise au carré de cette valeur donne une mesure de la variance expliquée.
Une explication facile à cela?
Merci beaucoup pour votre aide!
Réponses:
Hand-wavingly, la corrélation peut être considéré comme une mesure de l'angle entre deux vecteurs, le vecteur dépendant et le vecteur indépendant . Si l'angle entre les vecteurs est , la corrélation est . La partie de expliquée par est de longueur et parallèle à (ou la projection de sur ). La partie non expliquée est de longueur et est orthogonal à . En termes de variances, nous avons Y X θ R cos ( θ ) Y X | | Y | | cos ( θ ) X Y X | | Y | | sin ( θ ) X σ 2 Y = σ 2 Y cos 2 ( θ ) + σ 2 Y sin 2 ( θ ) R 2 RR Oui X θ R cos( θ ) Y X ||Y||cos(θ) X Y X ||Y||sin(θ) X
la source