Existe-t-il une explication de l'erreur racine moyenne quadratique (RMSE) pour les nuls?

14

Avoir une expertise globale en SIG n'est parfois pas suffisant pour bien comprendre certains concepts de la science SIG. Pour ajouter à cela, je ne suis pas non plus mathématicien.

Compte tenu de cela, quelqu'un serait-il en mesure de proposer à un enfant une explication de l' erreur quadratique moyenne (RMSE) lors du géoréférencement d'une image sur un fond de carte? Après avoir effectué cette opération mille fois, ma seule préoccupation a été de trouver d'abord des emplacements sur la carte cible qui se trouvent également sur la carte de base. En utilisant le bon sens comme outil, je trouvais généralement des églises, des bâtiments anciens et des objets similaires qui sont des structures très stables et ne se seraient pas déplacés dans la différence de temps entre le fond de carte et l'image cible. Après avoir placé autant de points de passe que possible, je regardais ensuite le tableau des statistiques et refaisais les points de passe avec un RMSE élevé ou les supprimais pour que le score RMSE global devienne aussi bas que possible.

Maintenant, je sais que le rmse est un calcul d'erreur statistique, mais ce qui m'a toujours dérangé, c'est que parfois je suis sûr à 100% que les points de passage sont placés très précisément sur les images ... par exemple. sur un clocher d'église, ou une autre structure stable qui est présente à la fois dans l'image cible et dans le fond de carte, mais le rmse est toujours élevé. Par conséquent, je serais en mesure de changer les points de passage à un emplacement plus éloigné de la structure de référence (c'est-à-dire rendre la transformation visuelle moins précise) afin de diminuer le rmse! Cela me semble être un paradoxe, car je diminuerais la précision visuelle de l'opération afin d'augmenter la précision statistique.

Parfois, j'ignore complètement la rmse parce que je peux voir qu'après l'opération de géoréférencement, la carte de référence et l'image cible s'alignent très bien ... c'est-à-dire que tous les points de passage sont exactement au bon endroit sur les deux cartes.

Quelqu'un pourrait-il me fournir une meilleure explication simple pour savoir si je fais quelque chose de fondamentalement mauvais ici?

Robert Buckley
la source
3
Commentaire semi-pertinent. N'utilisez jamais des choses comme des agrafes d'église de hauts bâtiments et des tours. Essayez d'utiliser des points près du niveau du sol
Devdatta Tengshe
1
Un RMSE inférieur n'est pas toujours synonyme d'un meilleur géoréférencement. L'exemple extrême est naturellement une transformation Spline qui réduira RMSE à 0, peu importe la précision ou non de vos points.
HDunn
2
Juste pour souligner ce que Devdatta a dit: à moins que vous ne géoréférenciez une carte qui utilise exactement la même imagerie aérienne, pixel par pixel, que la carte à laquelle vous vous référez , vous ne devriez pas utiliser un clocher d'église pour géoréférencer quoi que ce soit si vous avez d'autres options . Les points de contrôle doivent être aussi proches du sol que possible. Si le clocher de votre église a été photographié sous deux angles différents et à des altitudes différentes, l'emplacement réel sur lequel vous cliquez pourrait être légèrement décalé.
Dan C
Ce message a vraiment aidé ce "mannequin" à visualiser RMSE: /gis/4802/rmse-between-two-rasters-step-by-step
Stu Smith

Réponses:

11

Il y a plusieurs problèmes à résoudre, et je pense que nous devrions les traiter un par un.

Je sens que tu essaies de demander

Comment géoréférencer une carte afin d'avoir le moins d'erreur RMS?

Si tel est le cas, je vous suggère de modifier votre question et de modifier le titre en conséquence.

Pour comprendre comment réduire l'erreur RMS, vous devez comprendre ce que signifie l'erreur RMS. Supposons qu'il y ait des npoints; Pour chaque point, vous avez les coordonnées que vous avez entrées et vous avez les coordonnées qui sont calculées. La différence entre ceux-ci est calculée en utilisant une géométrie euclidienne simple, et c'est ce qu'on appelle l'erreur.

Pour obtenir l'erreur globale, nous additionnons ces erreurs. nous ne prenons pas une moyenne arithmétique simple, mais utilisons un RMS de ces erreurs. Il y a plusieurs raisons scientifiques à cela, mais mes connaissances statistiques sont beaucoup trop faibles pour vous les expliquer.

Donc, fondamentalement, vous calculez l'erreur RMS en utilisant la formule suivante: RMS error=Square Root(Σ(e^2)/n)

Venons-en maintenant à la question que vous posez vraiment. Comment pouvons-nous réduire cette erreur RMS? Pour ce faire, vous devez faire attention à la façon dont les coordonnées calculées sont réellement calculées. Il y a deux points principaux à aborder ici:

Vous devez d'abord sélectionner la transformation appropriée pour le géoréférencement. Il existe de multiples transformations (affine / Spline, 1er ordre, 2e ordre, etc.). Je peux mieux citer whuber, qui dans cette excellente réponse dit:

Utilisez une méthode qui peut représenter les distorsions qui auraient pu se produire. Avec la numérisation de cartes papier, les distorsions peuvent être locales et irrégulières, pensez donc aux splines. Avec les changements de projection (y compris ceux qui se produisent dans la plupart des traitements d'images aériennes et satellites), la transformation appropriée à utiliser est projective. Les transformations projectives ne sont ni des polynômes (en général) ni des splines.

Deuxièmement, vous devez faire attention lors de la sélection des points de contrôle pour votre géoréférencement. Whuber dans sa réponse liée ci-dessus fait plusieurs pointeurs dans cette direction.

Vous devez sélectionner les points qui seraient présents dans les deux images. Des choses comme les monuments, les passages à niveau, les structures permanentes, etc. sont généralement utilisées. Essayez d'utiliser des objets au niveau du sol ou plus près. N'utilisez pas de bâtiments élevés, de flèches d'église ou de tours, comme vous l'avez mentionné dans la question.

La raison est simple. La plupart des rasters sont pris sous un angle et offrent une vue oblique. Par conséquent, les objets hauts sembleront se pencher dans une direction pointant vers l'extérieur à partir de l'axe focal du capteur. Par exemple, regardez l'image Google Maps suivante de la Tour Eiffel. Le point rouge est approximativement là où le centre devrait être, mais vous voyez le sommet de la tour au point cyan. (Ceci est juste illustratif. La vue satellite de Google Map est traitée pour supprimer ces types d'artefacts, mais beaucoup restent encore)
entrez la description de l'image ici

Devdatta Tengshe
la source
1
Je pense que vous voulez dire erreur RMS = racine carrée (Σ (e ^ 2) / n)
Llaves
Salut .... merci pour tous les commentaires. Pour simplifier ma question à sa forme la plus basique serait la suivante: "Pourquoi dois-je examiner le RMSE si je suis satisfait du résultat visuel de l'image cible géoréférencée? En fin de compte, nous allons généralement regarder la carte de base et définir la transparence de l'image cible à 50%. S'il y a une erreur rmse comprise entre 2 et 9 pour les points de passage, mais l'image s'aligne bien, peu importe les erreurs?
Robert Buckley
@RobertBuckley: Si telle est votre question, veuillez consulter gis.stackexchange.com/questions/8900/… . Il n'y a pas d'erreur RMS spécifique que vous devriez essayer d'atteindre. L'erreur RMS n'est qu'une mesure indicative, et vous pouvez l'ignorer si vous pensez que le résultat est assez bon.
Devdatta Tengshe