Quelle est la différence entre plusieurs R et R au carré?

14

En régression linéaire, nous obtenons souvent plusieurs R et R au carré. Quelles sont les différences entre eux?

RockTheStar
la source

Réponses:

15

R2r2R2RR2=r2RR2

Une autre différence simple est l'interprétation. En régression multiple, le multiple est le coefficient de corrélation multiple , tandis que son carré est le coefficient de détermination . R peut être interprété un peu comme un coefficient de corrélation bivariée , la principale différence étant que la corrélation multiple se situe entre la variable dépendante et une combinaison linéaire des prédicteurs, pas n'importe lequel d'entre eux, et pas seulement la moyenne de ces corrélations bivariées. R 2 peut être interprété comme le pourcentage de variance dans la variable dépendante qui peut être expliqué par les prédicteurs ; comme ci-dessus, cela est également vrai s'il n'y a qu'un seul prédicteur.RRR2

Nick Stauner
la source
5
Donc, si dans une régression multiple R ^ 2 est 0,76, alors nous pouvons dire que le modèle explique 76% de la variance de la variable dépendante, alors que si r ^ 2 est 0,86, nous pouvons dire que le modèle explique 86% de la variance dans la variable dépendante? Quelle est la différence dans leur interprétation?
wizlog
Comme la réponse le suggère - «R multiple» implique plusieurs régresseurs. Est-il possible d'avoir plusieurs valeurs R dans un modèle à régresseur unique?
Abrar
2

Le R multiple peut en fait être considéré comme la corrélation entre la réponse et les valeurs ajustées. En tant que tel, il est toujours positif. Multiple R-squared est sa version au carré.

Permettez-moi d'illustrer en utilisant un petit exemple:

set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)

fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared:  0.2347

(R <- cor(y, fitted(fit))) # 0.4845068
R^2                        # 0.2347469

Il n'est pas nécessaire de faire beaucoup de bruit autour de "multiple" ou non. Cette formule s'applique toujours, même dans un cadre Anova. Dans le cas où il n'y a qu'une seule covariable , alors R avec le signe de la pente est la même que la corrélation entre X et la réponse.XX

Michael M
la source
0

J'explique simplement à mes élèves que:

  1. le multiple R doit être considéré comme la valeur absolue du coefficient de corrélation (ou du coefficient de corrélation sans signe négatif)!

  2. Le R au carré est simplement le carré du multiple R. Il peut représenter jusqu'à un pourcentage de variation causé par la ou les variables indépendantes.

Il est facile de saisir le concept et la différence de cette façon.

Senith
la source