Quelle est la différence entre «coefficient de détermination» et «erreur quadratique moyenne»?

33

Pour le problème de régression, j'ai vu des gens utiliser le «coefficient de détermination» (alias R au carré) pour effectuer la sélection du modèle, par exemple pour trouver le coefficient de pénalité approprié pour la régularisation.

Cependant, il est également courant d'utiliser "l'erreur quadratique moyenne" ou "l'erreur quadratique moyenne" comme mesure de la précision de la régression.

Quelle est donc la principale différence entre ces deux? Pourraient-ils être utilisés de manière interchangeable pour les tâches de «régularisation» et de «régression»? Et quelle est la principale utilisation de chacun dans la pratique, comme dans l'apprentissage automatique, les tâches d'exploration de données?

dolaameng
la source

Réponses:

40

, oùSSEest la somme des erreurs au carré (résidus ou écarts par rapport à la droite de régression) etSSTest la somme des écarts au carré de lamoyenneYde la personne à charge.R2=1SSESSTSSESSTY

, oùnest la taille de l'échantillon etmest le nombre de paramètres dans le modèle (y compris l'interception, le cas échéant).MSE=SSEnmnm

est une mesure normalisée du degré de prévisibilité, ou de l'ajustement, dans l'échantillon. M S E est l'estimation de la variance des résidus, ou non-ajustement, dans la population. Les deux mesures sont clairement liées, comme le montre la formule la plus courante pourle R 2 ajusté(l'estimation du R 2 pour la population):R2MSE R2R2

Radj2=1(1R2)n1nm=1SSE/(nm)SST/(n1)=1MSEσy2

tnphns
la source
2
Je pensais que MSE est la moyenne des erreurs, ce qui signifie MSE = SSE / n, à quelles occasions utilisons-nous MSE = SSE / (nm)? S'il vous plaît, expliquez. Merci
Sincole Brans
@SincoleBrans Veuillez consulter en.wikipedia.org/wiki/Mean_squared_error , section "Regression".
ttnphns
Je suis un peu confus. Les résultats dans martin-thoma.com/regression montrent qu'un modèle peut être bon (par rapport à certains autres modèles) avec R ^ 2, mais en même temps mauvais avec MSE. Pourriez-vous expliquer cela?
Martin Thoma