Mesurer la différence de performances entre Fusionner et Ajouter dans ArcGIS Desktop?

12

Souvent, je me retrouve dans une situation où je me fiche que mon outil produise ou non une nouvelle classe d'entités, mais je me soucie du temps qu'il faut pour combiner tous mes grands ensembles de données. La production d'une nouvelle classe d'entités prend-elle plus de temps à l'aide de l'outil Fusionner au lieu de l'outil Ajouter, ou les fonctions Fusionner et Ajouter sont-elles essentiellement les mêmes en termes de performances?

MTerry
la source
2
Quelques preuves anecdotiques: j'ai toujours trouvé que la fusion était plus rapide, surtout quand il s'agissait de grandes quantités de fonctionnalités.
Devdatta Tengshe
mais Append fonctionne mieux lorsque vous avez des domaines et des sous-types prédéfinis.
Mapperz

Réponses:

6

La fusion prend à la fois la géométrie et les attributs et combine (fusionne) l'ensemble de données complet dans un nouvel ensemble de données d'entité. entrez la description de l'image ici

Ajouter est un bon moyen de joindre des données supplémentaires à un ensemble de données existant - il peut avoir des options pour contrôler les sous-types d'entités ajoutées.

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000

La principale différence est

Si le type de schéma TEST est spécifié, le schéma (définitions de champ) des jeux de données d'entrée doit correspondre à celui du jeu de données cible pour que les entités soient ajoutées. Si le type de schéma NO_TEST est spécifié, le schéma du jeu de données en entrée (définitions de champ) ne doit pas nécessairement correspondre au jeu de données cible. Cependant, tous les champs des jeux de données d'entrée qui ne correspondent pas aux champs du jeu de données cible ne seront pas mappés au jeu de données cible, sauf si le mappage est explicitement défini dans le contrôle Field Map.

sous-type (Facultatif) Une description de sous-type pour affecter ce sous-type à toutes les nouvelles données qui sont ajoutées à l'ensemble de données cible.

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000

entrez la description de l'image ici

Vous pourriez être intéressé par le «Traitement en mosaïque de grands ensembles de données»

http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000

Mapperz
la source
1
Je suis conscient des différences entre les outils, mais je me demande si ces différences entraînent une différence significative dans le temps de traitement. J'utilise généralement NO_TEST lorsque j'utilise l'outil d'ajout car je m'assure que mes définitions de champ correspondent avant d'ajouter / fusionner.
MTerry
5

Prenez ces réponses en fonction des outils eux-mêmes et non d'une référence réelle:

L'outil de fusion crée une nouvelle classe d'entités, qui prend du temps en soi, avant de regrouper les deux jeux de données.

L'outil d'ajout avec l'option TEST suppose que les deux ensembles de données ont les mêmes champs (noms de champ) et les rassemble sans avoir à créer une nouvelle classe d'entités (sonne plus rapidement).

L'outil d'ajout avec l'option NO TEST permet au mappage de champs de se combiner comme des classes d'entités qui peuvent avoir des noms de champs différents. Cela nécessite des tests conditionnels en coulisse, ce qui prendrait plus de temps.

À mesure que la taille de l'ensemble de données augmente, le temps qu'il faut pour créer un nouveau fc semble insignifiant. La seule façon de savoir avec certitude serait de faire des benchmarks avec vos grands ensembles de données et de poster les réponses ici!

Je soupçonne que la différence n'est pas beaucoup, c'est plutôt ce que vous voulez à la fin de l'outil (mappage de champ vs nouvelle classe d'entités vs aucune nouvelle classe d'entités)

Roy
la source
0

Je viens de lancer les trois variantes. J'ai toujours combiné les 63 mêmes fichiers de formes. Chaque fichier de formes contient environ 63 000 points créés à partir d'une opération RasterToPoint. Tous les fichiers de formes ont la même table d'attributs.

Les différentes variantes ont eu besoin des temps suivants pour compiler:

  • Fusion: 13 min 57 s
  • Ajouter avec TEST: 8 minutes 34 secondes
  • Ajouter avec NO_TEST: 9 min 12 s

Il semble que Ajouter avec TEST comme paramètre d'entrée soit le plus rapide. Évidemment, le choix de l'Append à utiliser ne dépend pas de la vitesse mais plutôt de vos fichiers d'entrée comme expliqué ci-dessus.

J'espère que c'est utile.

Alexandre
la source