Décider quelle méthode d'interpolation utiliser pour le rééchantillonnage des données raster?

40

Existe-t-il des règles strictes concernant les méthodes d'interpolation adaptées à chaque type de données raster?

à neuf
la source
1
Qu'est-ce que vous interpolez? L'objectif est-il simplement de visualiser ou de mesurer réellement un type de distribution? Cependant, il ne s'agit pratiquement pas de règles strictes ou rapides.
Andy W
4
@ninesided: Êtes-vous sûr de vouloir indiquer des données "raster"? La réponse que vous avez acceptée fait uniquement référence aux méthodes d’interpolation de données vectorielles (ponctuelles et linéaires).
whuber
5
Le titre de la question est un peu ambigu. Les mots interpolation et rééchantillonnage signifient deux choses légèrement différentes. Interpoler, c'est prendre un échantillon de points de données discrets (raster ou vecteur) et en calculer une surface continue. Le rééchantillonnage consiste à prendre un groupe de points (encore une fois, un raster ou un vecteur), à leur appliquer une sorte d'algorithme et à produire un nouvel ensemble de points. Donc, je crois que l’interpolation peut être considérée comme un type de ré-échantillonnage.
Don Meltz
2
À mon humble avis, le titre est faux. "rééchantillonnage des données raster" me fait penser que vous avez un raster et que vous souhaitez en générer un nouveau plus grand / plus petit. Si vous souhaitez produire un raster en interpolant des points vectoriels, le "rééchantillonnage" est un terme incorrect.
underdark
3
@ninesided - Puisque vous avez choisi ma réponse comme réponse à votre question, je suppose que vous cherchiez à interpoler un ensemble de points discrets sur une surface de trame continue. Le mot resample est interprété par la plupart des lecteurs comme une conversion d'un raster en un autre, basée sur un algorithme. Je ne pense pas que vous ayez tort d'utiliser le mot parce que je crois que l'interpolation est une forme de rééchantillonnage. C'est juste que la plupart ne le voient pas de cette façon. Je ne prétends pas être un expert dans ce domaine, les corrections apportées à mon hypothèse sont donc les bienvenues.
Don Meltz

Réponses:

11

Je conviens qu'il n'y a pas de règles strictes, mais il existe des directives pour différentes méthodes d'interpolation. Par exemple, IDW est préférable lorsque vous avez au départ des points assez denses. Le krigeage nécessite beaucoup de processeurs et est généralement utilisé dans la modélisation des sols / géologie. La spline est généralement utilisée lorsqu'une surface lisse est souhaitée, par exemple les données de température. Certaines méthodes permettent au raster résultant de passer par les points d'origine, tandis que d'autres ne le font pas.

Bien que centré sur ArcGIS, vous trouverez un bon aperçu des différentes méthodes dans le document de 4 pages.

Interpolation de surfaces dans ArcGIS Spatial Analyst

Don Meltz
la source
41

Une clarification de la question indique que des méthodes de rééchantillonnage d'un raster sont recherchées. Beaucoup sont utilisés dans les communautés d' imagerie et de photographie . Pour le travail SIG, cependant, plusieurs méthodes simples sont couramment utilisées:

  • Rééchantillonnage du voisin le plus proche . Chaque cellule du nouveau raster se voit attribuer la valeur de la cellule la plus proche (centre à centre) du raster d'origine. Utilisez-le pour des données catégorielles telles que l'utilisation des terres et d'autres classifications.

  • Interpolation bilinéaire . Une moyenne est attribuée à chaque cellule du nouveau raster en fonction des quatre cellules d'origine les plus proches. La moyenne est linéaire dans les directions horizontale et verticale. (La formule résultante, cependant, n'est pas linéaire; elle est en réalité quadratique.) C'est bon pour le lissage à usage général, mais la moyenne qui est utilisée réduit généralement un peu les pics et les vallées locales.

  • Convolution cubique . Ceci est similaire dans l’esprit à l’interpolation bilinéaire mais peut légèrement extrapoler les valeurs des cellules proches. Il le fait de manière à reproduire les moyennes locales et la variabilité dans la nouvelle grille; en particulier, la coupure des extrema locaux ne devrait pas être aussi grave. (Une conséquence fâcheuse, évidente en tant que bogue dans ArcGIS d’ESRI, est que les valeurs de la nouvelle grille peuvent s’étendre au-delà de la plage de l’ancienne, causant ainsi le rendu incorrect de certains nouveaux extrêmes, mais c’est une question de données. affichage uniquement.) Le compromis est que la convolution cubique prend un peu plus de temps à calculer que l’interpolation bilinéaire.

Je discute en détail des deux dernières méthodes sur http://www.quantdec.com/SYSEN597/GTKAV/section9/map_algebra.htm

Pour des calculs ponctuels rapides, je me contente généralement d'effectuer une interpolation bilinéaire (pour les données continues) ou du plus proche voisin (pour des données catégorielles). Pour tous les autres, en particulier lors de la préparation d'ensembles de données maîtres ou de l'anticipation de manipulations étendues, je recommande l'utilisation de la convolution cubique (en plus de réfléchir à l'ordre des opérations afin de minimiser la propagation de l'erreur en virgule flottante).

whuber
la source
Quelques conseils supplémentaires utiles apparaissent dans les commentaires à l' adresse gis.stackexchange.com/questions/17328/… .
whuber
18

Selon ESRI, les méthodes d'interpolation disponibles (disponibles en tant qu'outils dans Spatial Analyst et d'autres extensions) sont comparées comme suit: (citation)

L' outil IDW (Inverse Distance Weighted) utilise une méthode d'interpolation qui estime les valeurs de cellule en faisant la moyenne des valeurs des points de données d'échantillon au voisinage de chaque cellule de traitement. Plus un point est proche du centre de la cellule en cours d’estimation, plus il a d’influence ou de poids dans le processus de calcul de la moyenne.

Le Krigeage est une procédure géostatistique avancée qui génère une surface estimée à partir d'un ensemble dispersé de points avec des valeurs z. Plus que d'autres méthodes d'interpolation prises en charge par ArcGIS Spatial Analyst, vous devez effectuer une analyse approfondie du comportement spatial du phénomène représenté par les valeurs z avant de sélectionner la meilleure méthode d'estimation pour générer la surface en sortie.

L' interpolation du voisin naturel recherche le sous-ensemble d'échantillons d'entrée le plus proche d'un point de requête et leur applique des pondérations en fonction de surfaces proportionnelles pour interpoler une valeur (Sibson, 1981). On l'appelle aussi Sibson ou interpolation "par zone".

L' outil Spline utilise une méthode d'interpolation qui estime les valeurs à l'aide d'une fonction mathématique qui minimise la courbure globale de la surface, ce qui donne une surface lisse qui traverse exactement les points d'entrée.

Spline avec barrières L'outil Spline avec barrières utilise une méthode similaire à la technique utilisée dans l'outil Spline, la principale différence étant que cet outil respecte les discontinuités codées à la fois dans les barrières d'entrée et les données de points d'entrée.

Les outils Topo à raster et Topo à raster par fichier utilisent une technique d'interpolation spécialement conçue pour créer une surface qui représente plus fidèlement une surface de drainage naturelle et qui préserve mieux les lignes de crêtes et les réseaux de flux des données de contour en entrée.

L'algorithme utilisé est basé sur celui d'ANUDEM, développé par Hutchinson et al à l'Université nationale australienne.

Tendance est une interpolation polynomiale globale qui adapte une surface lisse définie par une fonction mathématique (un polynôme) aux points d’échantillon en entrée. La surface de tendance change progressivement et capture les modèles à échelle grossière dans les données.

Vous pouvez également consulter cet article: http://proceedings.esri.com/library/userconf/proc95/to100/p089.html

Jakub Sisak GeoGraphics
la source
1
+1 pour choisir quelque chose dans l’aide ESRI pour citer un devis qui a du sens et qui est correct!
whuber
Pourriez-vous mettre à jour le lien vers la procédure, celui que vous avez publié n'est plus disponible (page introuvable). Vous pouvez également placer un titre ou des informations nous permettant de le rechercher sur la page ESRI.
Renata Dis
2

Les deux autres méthodes sont Average4 et Average16. Ils font ce qu'ils ont l'air et prennent la moyenne des 4 ou 16 cellules environnantes.

Le cas d'utilisation ici est principalement pour les données DEM. Vous ne l'utiliseriez pas sur une image raster (couleur 3 bandes surtout)

Ce n'est pas pondéré par la distance, mais dans ce cas, je ne pense pas que je l'emploierais pour un raster (uniquement un vecteur), car la distance dans un jeu de données raster est un peu plus subjective.

J'ai toujours pensé que Median4 et Median16 seraient un bon moyen de supprimer les creux et les pics des données de DEM, bien que je ne sache pas qu'il existe de paquet qui le permette.

Mark Ireland
la source
2
Votre suggestion d'utiliser les médianes de quartier pour filtrer les valeurs aberrantes locales des DEM est une bonne solution, Mark. Le package GRID / Spatial Analyst de ESRI inclut les médianes de quartier depuis très longtemps, je sais que l’IDRISI peut le faire, et probablement GRASS et Manifold également. Mais ces méthodes ne constitueraient pas un choix judicieux pour ré-échantillonner une grille. De même, les autres méthodes que vous mentionnez n'auraient pas de bonnes propriétés: elles lisseraient efficacement les données d'origine à la résolution de la grille d'origine et ne devraient donc pas être prises en compte pour le rééchantillonnage.
whuber