Souvent, je me retrouve dans une situation où je me fiche que mon outil produise ou non une nouvelle classe d'entités, mais je me soucie du temps qu'il faut pour combiner tous mes grands ensembles de données. La production d'une nouvelle classe d'entités prend-elle plus de temps à l'aide de l'outil Fusionner au lieu de l'outil Ajouter, ou les fonctions Fusionner et Ajouter sont-elles essentiellement les mêmes en termes de performances?
12
Réponses:
La fusion prend à la fois la géométrie et les attributs et combine (fusionne) l'ensemble de données complet dans un nouvel ensemble de données d'entité.
Ajouter est un bon moyen de joindre des données supplémentaires à un ensemble de données existant - il peut avoir des options pour contrôler les sous-types d'entités ajoutées.
http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000
La principale différence est
Si le type de schéma TEST est spécifié, le schéma (définitions de champ) des jeux de données d'entrée doit correspondre à celui du jeu de données cible pour que les entités soient ajoutées. Si le type de schéma NO_TEST est spécifié, le schéma du jeu de données en entrée (définitions de champ) ne doit pas nécessairement correspondre au jeu de données cible. Cependant, tous les champs des jeux de données d'entrée qui ne correspondent pas aux champs du jeu de données cible ne seront pas mappés au jeu de données cible, sauf si le mappage est explicitement défini dans le contrôle Field Map.
sous-type (Facultatif) Une description de sous-type pour affecter ce sous-type à toutes les nouvelles données qui sont ajoutées à l'ensemble de données cible.
http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000
Vous pourriez être intéressé par le «Traitement en mosaïque de grands ensembles de données»
http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000
la source
Prenez ces réponses en fonction des outils eux-mêmes et non d'une référence réelle:
L'outil de fusion crée une nouvelle classe d'entités, qui prend du temps en soi, avant de regrouper les deux jeux de données.
L'outil d'ajout avec l'option TEST suppose que les deux ensembles de données ont les mêmes champs (noms de champ) et les rassemble sans avoir à créer une nouvelle classe d'entités (sonne plus rapidement).
L'outil d'ajout avec l'option NO TEST permet au mappage de champs de se combiner comme des classes d'entités qui peuvent avoir des noms de champs différents. Cela nécessite des tests conditionnels en coulisse, ce qui prendrait plus de temps.
À mesure que la taille de l'ensemble de données augmente, le temps qu'il faut pour créer un nouveau fc semble insignifiant. La seule façon de savoir avec certitude serait de faire des benchmarks avec vos grands ensembles de données et de poster les réponses ici!
Je soupçonne que la différence n'est pas beaucoup, c'est plutôt ce que vous voulez à la fin de l'outil (mappage de champ vs nouvelle classe d'entités vs aucune nouvelle classe d'entités)
la source
Je viens de lancer les trois variantes. J'ai toujours combiné les 63 mêmes fichiers de formes. Chaque fichier de formes contient environ 63 000 points créés à partir d'une opération RasterToPoint. Tous les fichiers de formes ont la même table d'attributs.
Les différentes variantes ont eu besoin des temps suivants pour compiler:
Il semble que Ajouter avec TEST comme paramètre d'entrée soit le plus rapide. Évidemment, le choix de l'Append à utiliser ne dépend pas de la vitesse mais plutôt de vos fichiers d'entrée comme expliqué ci-dessus.
J'espère que c'est utile.
la source