J'implémente la validation croisée et calcule des métriques d'erreur telles que RMSE, , MAE, MSE, etc.
RMSE et MAE peuvent-ils avoir la même valeur?
cross-validation
rms
mae
Perl
la source
la source
Réponses:
Oui, en théorie. Le cas le plus simple que je peux imaginer est un ensemble de données où toutes les erreurs de prédiction (c'est-à-dire les résidus) sont exactement± 1. RMSE et MAE renverront des valeurs identiques de 1. On peut également construire d'autres scénarios, mais aucun ne semble très probable.
EDIT: Merci à @DilipSarwate d'avoir souligné (développé par @ user20160 dans son excellente réponse) que ce résultat est possible si et seulement si les valeurs absolues de toutes les erreurs de prédiction sont identiques. En d' autres termes, la valeur± 1 n'a rien de spécial dans mon exemple; tout autre nombre fonctionnerait au lieu de 1.
la source
L'erreur absolue moyenne (MAE) peut être égale à l'erreur quadratique moyenne (MSE) ou à l'erreur quadratique moyenne (RMSE) dans certaines conditions, que je montrerai ci-dessous. Ces conditions sont peu susceptibles de se produire dans la pratique.
Préliminaires
Soitrje= | yje- y^je| désigne la valeur absolue du résidu pour le je ème point de données, et soit r = [ rje, … , Rn]T un vecteur contenant des résidus absolus pour tous les n points de l'ensemble de données. Soit 1⃗ désigne un vecteur n × 1 de l'un, le MAE, le MSE et le RMSE peuvent s'écrire:
MSE
Définir le MSE égal au MAE et réorganiser donne:
Le MSE et le MAE sont égaux pour tous les ensembles de données où les résidus absolus résolvent l'équation ci-dessus. Deux solutions évidentes sont:r = 0⃗ (il n'y a pas d'erreur) et r = 1⃗ (les résidus sont tous ± 1 , comme mentionné mkt). Mais, il existe une infinité de solutions.
Nous pouvons interpréter l'équation( 2 ) géométriquement comme suit: Le LHS est le produit scalaire de r - 1⃗ et r . Le produit à point zéro implique l'orthogonalité. Ainsi, le MSE et le MAE sont égaux si la soustraction de 1 de chaque résidu absolu donne un vecteur orthogonal aux résidus absolus d'origine.
De plus, en remplissant le carré, l'équation( 2 ) peut être réécrite comme:
Cette équation décrit une sphère àn dimensions centrée sur [ 12, … , 12]T avec rayon12n--√ . Le MSE et le MAE sont égaux si et seulement si les résidus absolus se trouvent à la surface de cette hypersphère.
RMSE
Régler le RMSE égal au MAE et réorganiser donne:
oùje est la matrice d'identité. L'ensemble de solutions est l' espace nul de UNE ; c'est-à-dire l'ensemble de tous les r tels que A r = 0⃗ . Pour trouver l'espace nul, notez que UNE est une matrice n × n avec des éléments diagonaux égaux à n - 1 et tous les autres éléments égaux à - 1 . L'énoncé A r = 0⃗ correspond au système d'équations:
Ou, réorganiser les choses:
Autrement dit, chaque élémentrje doit être égal à la moyenne des autres éléments. La seule façon de satisfaire à cette exigence est que tous les éléments soient égaux (ce résultat peut également être obtenu en considérant la composition par eigend de UNE ). Par conséquent, l'ensemble de solutions se compose de tous les vecteurs non négatifs avec des entrées identiques:
Ainsi, le RMSE et le MAE sont égaux si et seulement si les valeurs absolues des résidus sont égales pour tous les points de données.
la source