Comment le centrage des données supprime-t-il l'interception dans la régression et la PCA?

41

Je continue à lire sur les cas où nous centrons les données (par exemple, avec régularisation ou PCA) afin de supprimer l'interception (comme mentionné dans cette question ). Je sais que c'est simple, mais j'ai du mal à comprendre cela intuitivement. Quelqu'un pourrait-il fournir l'intuition ou une référence que je peux lire?

Alec
la source
2
C'est un cas très particulier de "contrôle pour les autres variables" comme expliqué (de plusieurs façons) à stats.stackexchange.com/questions/17336/… . La "variable" contrôlée est le terme constant (interception).
whuber

Réponses:

67

Ces images peuvent-elles aider?

Les 2 premières images concernent la régression. Centrer les données ne modifie pas la pente de la ligne de régression, mais rend l'interception égale à 0.

entrez la description de l'image ici

1

entrez la description de l'image ici


1

tnphns
la source
1
y¯X¯β
17
PCA is maximizing varianceCe n'est généralement pas vrai. PCA maximise (par le 1er PC) les écarts de la somme des carrés de l'origine. Ce n'est que si les données étaient préalablement centrées (le centrage en soi ne fait pas partie de la PCA) que la variance est maximisée.
ttnphns
3
PS Notez que le calcul des covariances ou des corrélations implique le centrage
ttnphns
1
> PS Notez que le calcul des covariances ou des corrélations implique un centrage. Si vous êtes d'accord avec vos autres commentaires, la covariance et la corrélation n'impliquent PAS un centrage. Ni la cor, ni la covar ne changent de valeur lorsqu'une constante additive est appliquée aux données.
TPM
1
C'est à l'envers. Les constantes additives n'affectent en effet pas les corrélations, mais c'est parce qu'elles sont soustraites dans les calculs, comme l'a souligné @ttphns. Cela dit, ce n’est pas une nouvelle réponse, mais un commentaire. Nous comprenons que vous n’avez pas encore assez de réputation pour commenter. C’est donc un utilisateur qui a suffisamment de réputation qui le déplace après l’avoir signalé.
Nick Cox