Options de normalisation d'adresse

9

Ok, donc avec ArcGIS 10, ESRI a déprécié la «normalisation des adresses» dans les nouveaux localisateurs, je sais que vous pouvez toujours utiliser les localisateurs 9.3.1 pour ce faire; mais je soupçonne fortement qu'après la version 10.1, nous verrons cela de moins en moins disponible.

La norme d'adressage FGDC accorde une grande valeur aux bonnes adresses ayant les valeurs Prefix, Prefix-Direction, Street-Name, Suffix, Suffic-Direction pour une bonne forme propre. Et mon agence en a besoin.

Existe-t-il d'autres outils que les gens utilisent pour prendre des adresses structurées et les analyser de manière assez fiable afin qu'elles puissent être stockées? Certains sont-ils gratuits?


* Mise à jour: * Je suis tombé sur ceci sur CodePlex (US Address Parser) et cela m'a donné un très bon point de départ. C'est vraiment sympa en ce que son code managé que je peux utiliser partout et jusqu'à présent, il a eu un taux de réussite très élevé pour décomposer les parties à réviser ligne par ligne et partie par partie.

DEWright
la source
1
Mon installation d'ArcGIS v10 comprend ArcToolBox, Geocoding Tools, Standardize Addresses. Les entrées peuvent être une table ou une classe d'entités, donc cela devrait fonctionner avec les données de référence spatiale et / ou les adresses brutes. Est-ce ce que vous recherchez?
klewis
1
Oui, mais lorsque vous avez eu la longue capacité de transmettre une adresse à un géocodeur, puis de récupérer le résultat avec une réponse standardisée, vous pouvez effectuer un appel de niveau SOAP pour un seul enregistrement à la fois. Maintenant; il vous reste à créer un service de géotraitement, l'hôte qu'il sépare du reste du système de géocodage. Ils ont donc rendu le processus plus complexe et le système actuel ayant de tels problèmes; ce n'est pas fiable.
DEWright

Réponses:

6

L'analyse d'une adresse est un processus compliqué, comme vous le savez sans doute.

En utilisant les données ZIP + 4 de l'USPS, vous pouvez déterminer si une rue existe dans une ville / un état / un code postal donné. Vous pouvez même vérifier qu'un numéro principal (numéro de maison) se trouve dans la plage ZIP + 4 correcte. Il est également possible d'ajuster les noms de ville et les noms de rue pour corriger les problèmes d'orthographe en utilisant des listes d'orthographe ainsi que des correspondances "sonores". Prendre une adresse et l'analyser dans les composants individuels, puis la comparer à une base de données d'adresses connues est le seul moyen de savoir que l'analyse a été effectuée correctement.

Savoir qu'une adresse rentre dans la zone assignée et savoir qu'il s'agit d'une adresse réelle et livrable sont des objectifs distincts. La première, l'approximation des adresses, est quelque chose que googlemaps fait très bien. Cependant, c'est juste cela, une approximation. Googlemaps ne vous permet pas de savoir si l'adresse est réellement livrable, ils vous montrent où elle se situerait sur la carte si elle était réelle. Ceci est extrêmement précieux du point de vue de la cartographie et leur degré de précision varie.

Certes, la base de données USPS a des défauts (beaucoup d'entre eux), mais ils sont certainement plus précis et corrects que toute autre base de données d'adresses américaines et c'est le degré de précision (et le fait qu'il est constamment mis à jour) sur lequel nous nous appuyons.

Je travaille également chez SmartyStreets et je voulais ajouter à la conversation. Si vous devez valider moins de 250 adresses par mois, l'API est gratuite. Si votre organisation est un groupe à but non lucratif , le service est entièrement gratuit et sans limite.

Jeffrey
la source
Nous construisons un service séparé dans mon agence pour travailler sur les portions de géocodage; où regroupera les données du comté et / ou de la ville pour une première couche de validation; puis passer dans des sources commerciales comme TomTom ou NavTeq avant Tiger. Où nous prenons la base d'un géocodeur composite ESRI et ajoutons des étapes ou des branches supplémentaires pour comparer le score source avec un autre et renvoyer le score le plus élevé des deux ou trois. Notre utilisation des bases de données AIS / AMS de l'USPS aide à la partie «livrable», couplée aux données du comté.
DEWright
Merci du partage, Jeffrey. Je modifierai (sous peu) votre réponse pour me conformer aux directives de notre site; veuillez consulter notre FAQ pour plus d'informations.
whuber
1

Oui, il existe des outils, la gratuité dépendra de l'emplacement de vos adresses. Il existe de nombreux nettoyeurs d'adresses non gratuits sous licence USPS. L'un de ceux que j'utilise est ZP4 . Je trouve que l'entrée et la sortie sont flexibles en fonction de la façon dont vous stockez vos données actuellement et de la façon dont vous souhaitez stocker vos données à l'avenir. Vous pouvez choisir de sortir vos données, pour les adresses qui correspondent aux adresses livrables dans les données USPS, en 7 fragments. Ces fragments correspondent au numéro de la maison, à la prédirection, au nom de la rue, au suffixe de la rue, à la postdirection, à l'abréviation de l'appartement et au numéro de l'appartement. C'est la solution de location coûteuse que j'ai trouvée.

ktreiche
la source
1
Bien que le ZP4 soit très bon marché (600 $ / an), les termes me rendent un peu méfiant et il semble que vous devez faire attention à la façon dont vous l'utilisez.
blord-castillo
1

Je travaille dans le domaine de la vérification d'adresse, en fait (une société appelée SmartyStreets) - où nous faisons la vérification d'adresse postale (aux États-Unis).

Vous aurez besoin d'un fournisseur de données d'adresse certifié CASS. Le logiciel de ces sociétés a été approuvé par l'USPS pour ajouter des informations manquantes à une adresse et renvoyer des résultats précis. Un de ces services est LiveAddress - ou si vous avez une liste d'adresses, il y a la Smartylist - qui vous donnera les informations dont vous avez besoin. Les deux sont gratuits dans une certaine mesure, mais assez abordables après cela.

Dans ArcGIS, je pense que l'API LiveAddress peut être implémentée par programme. Alternativement, une liste d'adresses peut être exportée vers une feuille de calcul ou CSV et téléchargée dans le service de nettoyage de liste.

Mat
la source
Je ne recherche pas vraiment la correction ou les certifications du publipostage, ce à quoi CASS est orienté; plus pour une analyse et une recherche améliorées afin de corriger les mauvaises adresses. J'ai déjà des bases de données USPS AIS et AMS et je commence maintenant à construire une logique pour analyser et interroger un enregistrement à partir de ces sources s'il ne correspond pas complètement. Je vais jeter un œil aux liens que vous référencez; mais je suis en train de construire une solution qui peut être partagée pour la plupart des adresses américaines à moindre coût. Ce n'est pas parce que USPS AIS / AMS ne trouve pas que c'est incorrect.
DEWright
@DEWright Vous avez raison. Il y a des adresses qui existent en dehors du domaine de l'USPS, mais la grande majorité d'entre elles se trouvent dans la base de données des adresses livrables de l'USPS. Fedex et UPS ont toutes deux des adresses (généralement des adresses distantes) auxquelles elles livrent et USPS ne les livrera pas. Ce serait bien d'avoir une source faisant autorité qui combine toutes ces adresses. La difficulté avec cela est que l'USPS ne partage pas exactement toute leur base de données, pas plus que Fedex ou UPS. Il s'agit pour la plupart de données propriétaires. La vérification d'adresse ne se limite pas à l'envoi.
Jeffrey
1

J'ai eu beaucoup de succès en utilisant la bibliothèque d'analyseurs d'adresses américains. J'ai construit un outil python qui utilise la bibliothèque pour créer les champs d'adresse analysés. https://github.com/datamade/usaddress

ketar
la source
0

YAddress est une autre option pour les adresses basées aux États- Unis . Il corrige et valide également l'adresse avant de la diviser en composants. (Je travaille pour l'entreprise qui le fabrique.)

Michael Diomin
la source