J'aimerais acquérir une compréhension conceptuelle de l'erreur quadratique moyenne (RMSE) et de l'écart de biais moyen (MBD). Après avoir calculé ces mesures pour mes propres comparaisons de données, j'ai souvent été perplexe de constater que le RMSE est élevé (par exemple, 100 kg), tandis que le MBD est faible (par exemple, moins de 1%).
Plus précisément, je recherche une référence (non en ligne) qui répertorie et discute les mathématiques de ces mesures. Quelle est la façon normalement acceptée de calculer ces deux mesures et comment dois-je les déclarer dans un article de journal?
Il serait vraiment utile dans le contexte de cet article d'avoir un ensemble de données "jouet" qui puisse être utilisé pour décrire le calcul de ces deux mesures.
Par exemple, supposons que je doive trouver la masse (en kg) de 200 widgets produits par une chaîne de montage. J'ai également un modèle mathématique qui tentera de prédire la masse de ces widgets. Le modèle n'a pas à être empirique et il peut être basé physiquement. Je calcule le RMSE et le MBD entre les mesures réelles et le modèle, constatant que le RMSE est de 100 kg et le MBD de 1%. Qu'est-ce que cela signifie conceptuellement et comment interpréter ce résultat?
Supposons maintenant que d'après le résultat de cette expérience, je trouve que le RMSE est de 10 kg et le MBD de 80%. Qu'est-ce que cela signifie et que puis-je dire à propos de cette expérience?
Quelle est la signification de ces mesures et qu'impliquent les deux (prises ensemble)? Quelles informations supplémentaires le MBD donne-t-il lorsqu'il est considéré avec le RMSE?
la source
Réponses:
Je pense que ces concepts sont faciles à expliquer. Je préfère donc simplement le décrire ici. Je suis sûr que de nombreux livres sur les statistiques élémentaires couvrent ce sujet, y compris mon livre "Les bases de la biostatistique pour les médecins, les infirmières et les cliniciens".
Pensez à une cible avec un œil de bœuf au milieu. L'erreur quadratique moyenne représente la distance quadratique moyenne d'une flèche sur la cible et le centre. Maintenant, si vos flèches se dispersent uniformément autour du centre, le tireur n'a pas de biais de visée et l'erreur quadratique moyenne est la même que la variance.
Mais en général, les flèches peuvent se disperser autour d'un point éloigné de la cible. La distance quadratique moyenne des flèches par rapport au centre des flèches est la variance. Ce centre pourrait être regardé comme le point de visée des tireurs. La distance entre le centre ou le point de visée de ce tireur et le centre de la cible est la valeur absolue du biais.
En pensant à un triangle rectangle où le carré de l'hypoténuse est la somme des carrés des deux côtés. Ainsi, une distance au carré de la flèche à la cible est le carré de la distance de la flèche au point de visée et le carré de la distance entre le centre de la cible et le point de visée. La moyenne de toutes ces distances carrées donne l'erreur quadratique moyenne comme la somme du biais au carré et de la variance.
la source
RMSE est un moyen de mesurer la qualité de notre modèle prédictif par rapport aux données réelles, plus le RMSE est petit, meilleur est le comportement du modèle, c'est-à-dire si nous l'avons testé sur un nouvel ensemble de données (pas sur notre ensemble d'entraînement) mais un RMSE de 0,37 sur une plage de 0 à 1, représente beaucoup d'erreurs par rapport à un RMSE de 0,01 comme meilleur modèle. BIAS sert à surestimer ou à sous-estimer.
la source
Pour autant que je puisse comprendre, un RMSE donne une valeur plus précise de l'erreur entre le modèle et observé, cependant le BIAS, en plus de donner une valeur de l'erreur (moins précise que le RMSE), il peut également déterminer si le modèle est biais positif ou biais négatif, si le modèle sous-estime ou surestime les valeurs observées.
la source