- Erreur quadratique moyenne
- somme résiduelle de carrés
- erreur standard résiduelle
- erreur quadratique moyenne
- erreur de test
Je pensais avoir l'habitude de comprendre ces termes, mais plus je fais de problèmes de statistiques, plus je me suis confus là où je devine moi-même. Je voudrais un peu de réassurance et un exemple concret
Je peux trouver les équations assez facilement en ligne, mais j’ai du mal à comprendre ces termes avec une explication 'comme si j’avais 5 ans' pour pouvoir cristalliser dans ma tête les différences et la façon dont on en mène les unes aux autres.
Si quelqu'un pouvait prendre ce code ci-dessous et indiquer comment je calculerais chacun de ces termes, je l'apprécierais. R code serait génial ..
En utilisant cet exemple ci-dessous:
summary(lm(mpg~hp, data=mtcars))
Montrez-moi en code R comment trouver:
rmse = ____
rss = ____
residual_standard_error = ______ # i know its there but need understanding
mean_squared_error = _______
test_error = ________
Points bonus pour expliquer comme je suis 5 les différences / similitudes entre ceux-ci. Exemple:
rmse = squareroot(mss)
la source
Réponses:
Comme demandé, j'illustrer en utilisant une régression simple en utilisant les
mtcars
données:L' erreur quadratique moyenne (MSE) est la moyenne du carré des résidus:
L’erreur quadratique moyenne (RMSE) est alors la racine carrée de MSE:
La somme résiduelle des carrés (RSS) est la somme des résidus au carré:
L’erreur standard résiduelle (RSE) est la racine carrée de (RSS / degrés de liberté):
Le même calcul, simplifié car nous avons précédemment calculé
rss
:Le terme erreur de test dans le contexte de la régression (et d’autres techniques d’analyse prédictive) désigne généralement le calcul d’une statistique de test sur des données de test, distincte de vos données d’entraînement.
En d'autres termes, vous estimez un modèle à l'aide d'une partie de vos données (souvent un échantillon de 80%), puis vous calculez l'erreur à l'aide de l'échantillon en attente. Encore une fois, j’illustre l’utilisation
mtcars
, cette fois avec un échantillon de 80%Estimer le modèle, puis prédire avec les données de rétention:
Combinez les données d'origine et la prédiction dans un cadre de données
Maintenant, calculez vos statistiques de test de manière normale. J'illustre MSE et RMSE:
Notez que cette réponse ignore la pondération des observations.
la source
L’affiche originale demandait une réponse "explique comme si j’avais 5 ans". Supposons que votre professeur d'école vous invite, ainsi que vos camarades de classe, à aider à deviner la largeur de la table de l'enseignant. Chacun des 20 élèves de la classe peut choisir un appareil (règle, échelle, bande ou mesure) et est autorisé à mesurer le tableau 10 fois. Vous êtes tous invités à utiliser différents emplacements de départ sur l'appareil pour éviter de lire le même numéro encore et encore; la lecture de départ doit ensuite être soustraite de la lecture de fin pour obtenir finalement une mesure de largeur (vous avez récemment appris à faire ce type de calcul).
Au total, 200 mesures de largeur ont été prises par la classe (20 étudiants, 10 mesures chacun). Les observations sont transmises à l'enseignant qui se chargera des chiffres. Soustraire les observations de chaque élève d'une valeur de référence donnera 200 autres nombres, appelés déviations . L'enseignant calcule en moyenne l'échantillon de chaque élève séparément, en obtenant 20 moyennes . En soustrayant les observations de chaque élève de leur moyenne individuelle, on obtiendra 200 écarts par rapport à la moyenne, appelés résidus . Si le résidu moyen devait être calculé pour chaque échantillon, vous remarquerez qu'il est toujours égal à zéro. Si au lieu de cela nous comparons chaque résidu, faisons la moyenne et finalement annulons le carré, nous obtenons l’ écart type. (En passant, nous appelons ce dernier calcul la racine carrée (pensez à trouver la base ou le côté d'un carré donné), ainsi l'ensemble de l'opération est souvent appelé racine-carré-carré , bref, l'écart-type des observations est égal à la racine carrée des résidus.)
Mais le professeur connaissait déjà la vraie largeur de la table, en fonction de la conception, de la construction et du contrôle de celle-ci en usine. Ainsi, 200 autres nombres, appelés erreurs , peuvent être calculés en tant que déviation des observations par rapport à la largeur vraie. Une erreur moyenne peut être calculée pour chaque échantillon d'étudiants. De même, 20 écarts-types de l'erreur , ou erreur-type , peuvent être calculés pour les observations. Plus 20 erreur de moyenne quadratiqueles valeurs peuvent également être calculées. Les trois ensembles de 20 valeurs sont liés par sqrt (me ^ 2 + se ^ 2) = rmse, par ordre d'apparition. Sur la base, l'enseignant peut déterminer à qui l'élève a fourni la meilleure estimation pour la largeur de la table. De plus, en regardant séparément les 20 erreurs moyennes et les 20 valeurs d'erreur standard, l'enseignant peut enseigner à chaque élève comment améliorer ses lectures.
À titre de vérification, l’enseignant a soustrait chaque erreur de leur erreur moyenne respective, ce qui a entraîné 200 autres nombres, que nous appellerons des erreurs résiduelles (c’est rarement le cas). Comme ci-dessus, l' erreur résiduelle moyenne est égale à zéro, de sorte que l' écart type des erreurs résiduelles ou l'erreur résiduelle standard est identique à l' erreur standard et qu'il en est de même de l' erreur résiduelle racine-carré-carré . (Voir ci-dessous pour plus de détails.)
Maintenant, voici quelque chose d'intéressant pour l'enseignant. Nous pouvons comparer la moyenne de chaque élève avec le reste de la classe (20 moyennes au total). Tout comme nous avons défini avant ces valeurs de points:
on peut aussi définir maintenant:
Seulement si la classe d'étudiants est dite impartiale, c'est-à-dire si mem = 0, alors sem = sm = rmsem; c'est-à-dire, l'erreur type de la moyenne, l'écart type de la moyenne et l'erreur quadratique moyenne, la moyenne peut être identique, à condition que l'erreur moyenne de la moyenne soit égale à zéro.
Si nous n'avions pris qu'un échantillon, c'est-à-dire s'il n'y avait qu'un seul étudiant en classe, l'écart-type des observations pourrait être utilisé pour estimer l'écart-type de la moyenne (sm), comme sm ^ 2 ~ s ^ 2 / n, où n = 10 est la taille de l'échantillon (le nombre de lectures par élève). Les deux s'accorderont mieux lorsque la taille de l'échantillon augmente (n = 10,11, ...; plus de lectures par élève) et que le nombre d'échantillons augmente (n '= 20,21, ...; plus d'élèves en classe). (Une mise en garde: une "erreur type" non qualifiée fait plus souvent référence à l'erreur type de la moyenne, et non à l'erreur type des observations.)
Voici quelques détails des calculs impliqués. La vraie valeur est notée t.
Opérations set-to-point:
ENSEMBLES INTRA-ÉCHANTILLONS:
POINTS INTRA-ÉCHANTILLONS (voir tableau 1):
ENSEMBLE INTER-ÉCHANTILLON:
POINTS ENSEMBLE INTER-ÉCHANTILLON (voir le tableau 2):
la source
Je pense aussi que tous les termes sont très déroutants. Je crois fermement qu'il est nécessaire d'expliquer pourquoi nous avons ces nombreux paramètres.
Voici ma note sur SSE et RMSE:
Première métrique: somme des erreurs au carré (SSE). Autres noms, Somme résiduelle des carrés (RSS), Somme des résidus carrés (SSR).
Si nous sommes dans la communauté d'optimisation, SSE est largement utilisé. C’est parce que c’est l’objectif de l’optimisation, où l’optimisation est
Deuxième métrique: erreur quadratique moyenne (RMSE) . Autres noms, déviation racine-moyenne-carrés.
RMSE est
la source