En particulier, je me demande pourquoi nous avons ce concept Multiple R (que je peux comprendre comme la corrélation entre les scores observés et prédits dans la régression multiple), puis un concept séparé R au carré qui est juste le carré ou R.
J'ai été informé que le R au carré est la variation en pourcentage expliquée et que R ne l'est pas, mais je ne comprends pas la distinction qui est faite entre la corrélation et la variation expliquée.
multiple-regression
user1205901 - Réintégrer Monica
la source
la source
Réponses:
Un problème principal ici est que la mesure de la "variation" dans l'analyse de régression est liée aux différences quadratiques des variables observées par rapport à leurs valeurs moyennes prévues. Il s'agit d'un choix utile d'une mesure de variation, à la fois pour l'analyse théorique et dans les travaux pratiques, car les différences au carré de la moyenne sont liées à la variance d'une variable aléatoire, et la variance de la somme de deux variables aléatoires indépendantes est simplement la somme de leurs variances individuelles.
Je crains de n'avoir jamais compris l'utilité de spécifier la valeur du Multiple R plutôt que . Contrairement au coefficient de corrélation dans une régression univariée, qui montre à la fois la direction et la force de la relation entre 2 variables, la spécification du multiple R ne semble pas ajouter beaucoup au-delà d'une chance de confusion supplémentaire.R2 r
la source