Je dois calculer la pente moyenne du pourcentage de pente ascendante pour un grand ensemble de données, la méthode de base est détaillée ici. Cependant, j'ai commencé à me demander si la moyenne harmonique pourrait être plus appropriée que la moyenne arithmétique standard, car il s'agit techniquement d'un taux de changement. Je n'ai vu cela apparaître dans aucune des autres discussions sur la moyenne de la pente sur des points, des zones, des lignes, etc. Cela devrait être assez simple à réaliser.
modifier: Le but du calcul de la pente moyenne dans ce cas est de générer un paramètre (parmi plusieurs) à utiliser dans la modélisation des seuils d'initiation de canal. J'ai un ensemble d'emplacements de tête de canal collectés sur le terrain que je collecterai l'accumulation de flux, divers paramètres de pente ascendante moyenne, etc., et utiliserai une régression linéaire multiple pour essayer de décrire les seuils d'accumulation en fonction des autres paramètres.
la source
Réponses:
La pente moyenne ressemble à une quantité naturelle mais c'est plutôt une chose étrange. Par exemple, la pente moyenne d'une plaine horizontale plate est nulle, mais lorsque vous ajoutez un tout petit peu de bruit aléatoire nul à un DEM de cette plaine, la pente moyenne ne peut que monter. D'autres comportements étranges sont la dépendance de la pente moyenne de la résolution DEM, que j'ai documentée ici , et sa dépendance de la façon dont le DEM a été créé. Par exemple, certains DEM créés à partir de cartes de contours sont en fait légèrement en terrasses - avec de minuscules sauts brusques où se trouvent les lignes de contour - mais sinon, ils sont des représentations précises de la surface dans son ensemble. Ces sauts brusques, s'ils reçoivent trop ou trop peu de poids dans le processus de calcul de la moyenne, peuvent modifier la pente moyenne.
L'augmentation de la pondération est pertinente car, en fait, une moyenne harmonique (et d'autres moyens) pondère différemment les pentes. Pour comprendre cela, considérons la moyenne harmonique de seulement deux nombres positifs x et y . Par définition,
où les poids sont a = y / (x + y) et b = x / (x + y). (Ceux-ci méritent d'être appelés "poids" car ils sont positifs et totalisent l'unité. Pour la moyenne arithmétique, les poids sont a = 1/2 et b = 1/2). Évidemment, le poids attaché à x , égal à y / (x + y), est grand quand x est petit comparé à y . Ainsi, l'harmonique signifie surpondérer les petites valeurs.
Cela peut aider à élargir la question. La moyenne harmonique fait partie d'une famille de moyennes paramétrées par une valeur réelle p . Tout comme la moyenne harmonique est obtenue en faisant la moyenne des inverses de x et y (puis en prenant l'inverse de leur moyenne), en général, nous pouvons faire la moyenne des pth puissances de x et y (puis prendre la puissance 1 / pth du résultat ). Les cas p = 1 et p = -1 sont respectivement les moyennes arithmétique et harmonique. (Nous pouvons définir une moyenne pour p = 0 en prenant des limites et ainsi obtenir la moyenne géométrique en tant que membre de cette famille.) Comme pdiminue à partir de 1, les valeurs les plus petites sont de plus en plus fortement pondérées; et lorsque p augmente à partir de 1, les valeurs les plus élevées sont de plus en plus fortement pondérées. Il s'ensuit que la moyenne ne peut augmenter que lorsque p augmente et doit diminuer lorsque p diminue. (Cela est évident dans la deuxième figure ci-dessous, dans laquelle les trois lignes sont soit plates soit croissantes de gauche à droite.)
En adoptant une vision pratique de la question, nous pourrions plutôt étudier le comportement de divers moyens de pente et ajouter ces connaissances à notre boîte à outils analytiques: lorsque nous nous attendons à ce que les pentes entrent en relation de telle manière que les pentes plus petites devraient recevoir plus de une influence, on pourrait choisir une moyenne avec p inférieur à 1; et inversement, nous pourrions augmenter p au-dessus de 1 afin de souligner les pentes les plus importantes. À cette fin, considérons différentes formes de profils de drainage au voisinage d'un point.
Pour montrer ce qui pourrait continuer, j'ai considéré trois terrains locaux qualitativement différents : l'un est où toutes les pentes sont égales (ce qui fait une bonne référence); une autre est l'endroit où nous nous situons localement au fond d'un bol: autour de nous les pentes sont nulles, mais augmentent progressivement et finalement, autour du bord, deviennent arbitrairement grandes. L'inverse de cette situation se produit lorsque les pentes proches sont modérées mais se stabilisent ensuite loin de nous. Cela semblerait couvrir un large éventail réaliste de comportements.
Voici des tracés pseudo-3D de ces trois types de formes de drainage:
Ici, j'ai calculé la pente moyenne de chacun - avec le même codage couleur - en fonction de p , en laissant p aller de -1 (moyenne harmonique) à 2.
Bien sûr, la ligne bleue est horizontale: quelle que soit la valeur de p , la moyenne d'une pente constante ne peut être autre que cette constante (qui a été fixée à 1 pour référence). Les hautes pentes autour du bord le plus éloigné du bol rouge influencent fortement les pentes moyennes car p varie: remarquez à quel point elles deviennent grandes une fois que p dépasse 1. Le bord horizontal dans la troisième surface (or-vert) provoque la moyenne harmonique (p = - 1) à zéro.
Il est à noter que les positions relatives des trois courbes changent à p = 0 (la moyenne géométrique): pour p supérieur à 0, le bol rouge a des pentes moyennes plus grandes que le bleu, tandis que pour p négatif , le bol rouge a une moyenne plus petite pentes que le bleu. Ainsi, votre choix de p peut même modifier le classement relatif des pentes moyennes.
L'effet profond de la moyenne harmonique (p = -1) sur la forme jaune-vert devrait nous faire réfléchir: il montre que lorsqu'il y a suffisamment de petites pentes dans le drainage, la moyenne harmonique peut être si petite qu'elle écrase toute influence de toutes les autres pistes.
Dans l'esprit d'une analyse exploratoire des données, vous pourriez envisager de faire varier p - peut-être en le laissant varier de 0 à légèrement supérieur à 1 afin d'éviter des poids extrêmes - et de trouver quelle valeur crée la meilleure relation entre la pente moyenne et la variable que vous modélisent (comme les seuils d'initialisation des canaux). «Meilleur» est généralement compris dans le sens de «plus linéaire» ou de «création de résidus [homoscédastiques] constants» dans un modèle de régression.
la source
J'ai entrepris une approche empirique pour trouver une réponse complémentaire à l'excellente réponse théorique de whuber. J'ai décidé de calculer la pente en degrés et la moyenne en utilisant une moyenne angulaire . Ensuite, j'ai calculé les moyennes arithmétiques et harmoniques de la pente en pourcentage, j'ai créé un ensemble de points d'échantillonnage situés au hasard dans la zone d'étude. J'ai demandé 2000 points avec une distance minimale de 100m, ce qui a rapporté 1326 points. J'ai échantillonné les valeurs de chaque raster de pente moyenne à chaque point et converti les pourcentages moyens en degrés en utilisant la formule
Degrees = atan(percent/100)
. Mon hypothèse ici est que la moyenne angulaire produira la pente moyenne "correcte" en degrés, et quel que soit le pourcentage moyen le plus proche, ce serait la bonne procédure.Ensuite, j'ai comparé toutes les valeurs non nulles en utilisant un test de Kruskal-Wallace (les hypothèses étant que pour la plupart des valeurs de pente zéro, ce serait zéro dans les trois, et que les valeurs nulles masqueraient les différences entre les méthodes). J'ai trouvé une différence significative entre les trois (chi carré = 17,9570, DF = 2, p = 0,0001), j'ai donc examiné les données en utilisant la procédure de Dunn en utilisant alpha = 0,05 (Elliot et Hynan 2011) . Le résultat final est que la moyenne arithmétique et harmonique sont significativement différentes l'une de l'autre, mais neigher est significativement différente de la moyenne angulaire:
Si mes hypothèses étaient toutes correctes (elles pourraient très bien ne pas l'être), cela signifie que bien que les moyens harmoniques et arithmétiques créent des valeurs différentes les uns des autres, ils sont tous les deux "étroitement liés" à la moyenne angulaire pour être acceptables. Il y a deux autres mises en garde ici auxquelles je peux penser (veuillez en ajouter d'autres si vous y pensez):
la source
Étant donné l'hypothèse qu'aucun paramètre définissant la pente n'est connu, tout statisticien dirait d'utiliser la pente qui minimise les écarts RMS des données. (Bien sûr, les exemples de whuber ne sont pas admissibles car il a choisi des formes de relief générées mathématiquement, mais pour les formes de relief réelles, l'hypothèse de paramètres inconnus devrait être valide.)
la source