Comment les scores de géocodage sont-ils calculés dans ArcGIS?

11

Une fois qu'une table d'adresses est géocodée, ArGIS fournit des informations sur chaque adresse géocodée, parmi lesquelles le "score de correspondance" du candidat auquel l'adresse a été mise en correspondance, qui varie de 0 à 100. Selon leur documentation "Le score de correspondance est basé sur sur la façon dont les emplacements trouvés dans les données de référence correspondent aux données d'adresse recherchées. "

Il semble intuitif que 100 signifie qu'une adresse avec le nom exact a été trouvée dans le localisateur d'adresses et 0 signifie qu'aucune adresse n'a été trouvée. Cependant, je n'ai trouvé aucune information sur la façon dont ce score est calculé, en particulier si les valeurs se situent quelque part entre les extrêmes. Je le sais?

J'ai trouvé le pointeur vers ce livre blanc dans la réponse à cette question , mais je n'ai trouvé aucune information dans ce livre qui répondrait à la question.

cengel
la source

Réponses:

10

Les scores sont basés sur un système de numérotation pondéré; sur la base du nombre de caractères correspondants dans chacune des zones d'éléments d'adresse priorisées / configurées. Donc, plus il y a de caractères qui peuvent correspondre, meilleure est la probabilité d'un score élevé.

Lors de l'utilisation de données d'adresses à distance telles que les lignes médianes des rues, la plage d'adresses et la parité feront également partie du processus. Donc, si vous avez une plage de 3000 à 6000 et que l'adresse est 2998, le reste du nom de rue correspond; ArcGIS en fera un candidat mais réduira le score car le nombre était en dehors de l'objectif attendu.

  • DEWright

Voir la réponse de Bruce Harold à Re: Geocoding Score Documentation: Comment la valeur du score est-elle déterminée? :

"Re: Documentation du score de géocodage: comment la valeur du score est-elle déterminée? Bruce Harold Employé de Bruce Harold de niveau 5 10 avril 2015 14:25 (en réponse à Nathan Lowry)

Bonjour

Le calcul du score n'est pas documenté en détail, mais je peux vous donner une miniature.

Si vous ouvrez USAddress.lot.xml dans Firefox à partir de son emplacement d'installation dans le fichier: /// C: / Program Files (x86) /ArcGIS/Desktop10./Locators, vous verrez une arborescence navigable.

Dans les éléments de niveau supérieur, accédez à FullNormalAddress; les nombres en exposant pour NormalAddress (70) et Zone (30) sont les poids relatifs pour les contributions de score de ces éléments. Par coïncidence, ils totalisent 100, mais seul le poids relatif est pertinent.

En naviguant plus loin de NormalAddress, vous verrez que 70/100 du score est contribué 15/75 et 60/75 respectivement par House et FullStreetName, où 75 est la somme des poids, et plus bas, vous pouvez voir le préfixe des éléments (5/92 ), prétype (6/92), poids StName (70/92), sous-type (6/92) et suffixe (5/92) où 92 est la somme de ces poids. Un score individuel pour tout élément de niveau le plus bas (comme la façon de calculer une contribution de score à partir d'un nom de rue imparfait) peut être déterminé par la section Orthographe / Scoring du fichier XML si une correction orthographique anticipée est nécessaire pour correspondre aux données de référence, ou par un algorithme propriétaire pour les fautes d'orthographe imprévues ou le bruit ou les caractères répétés, comme lorsque vous avez un keybounce.

Les scores sont additionnés en poids, avec un pourcentage de normalisation, de bas en haut. Les éléments manquants ne pénalisent pas un score, ils ne contribuent tout simplement pas.

DEWright
la source