Comment résumer et comparer des relations non linéaires?

10

J'ai des données sur le pourcentage de matière organique dans les sédiments lacustres de 0 cm (c.-à-d. L'interface sédiment-eau) à 9 cm pour environ 25 lacs. Dans chaque lac, 2 carottes ont été prélevées à chaque emplacement, j'ai donc 2 mesures répétées du pourcentage de matière organique à chaque profondeur de sédiment pour chaque lac.

Je souhaite comparer les différences entre les lacs dans la relation entre le pourcentage de matière organique et la profondeur des sédiments (c.-à-d. La pente). Dans certains lacs, la relation entre le pourcentage de matière organique et la profondeur des sédiments semble linéaire, mais dans d'autres cas, la relation est plus complexe (voir les exemples ci-dessous).

Mes pensées initiales étaient d'adapter les relations linéaires, le cas échéant, à l'ensemble de la courbe ou à un sous-ensemble de la courbe si elle était "principalement" linéaire et de comparer uniquement les lacs où une relation linéaire significative a été trouvée. Cependant, je ne suis pas satisfait de cette approche en ce qu'elle nécessite d'éliminer les données pour aucune autre raison qu'elles ne correspondent pas au modèle linéaire et qu'elle ignore les informations potentiellement intéressantes sur la relation entre le pourcentage de matière organique et la profondeur des sédiments.

Quelle serait une bonne façon de résumer et de comparer les courbes de différents lacs?

Je vous remercie

Exemples de courbes: dans tous les cas, l'axe des y est le pourcentage de matière organique dans les sédiments et l'axe des x est la profondeur des sédiments où 0 = l'interface sédiment-eau.

Un bel exemple linéaire:

Un bel exemple linéaire

2 exemples non linéaires:

non linéaire 1

enonlinear 2

Un exemple sans relation évidente:

pas de relation

DQdlM
la source

Réponses:

2

Découvrez les modèles additifs généralisés , qui permettent d'ajuster des fonctions non linéaires sans spécification a priori de la forme non linéaire. Je ne sais pas cependant comment on pourrait comparer les ajustements ultérieurs. Une autre approche similaire (en ce que je crois qu'ils utilisent tous les deux des splines cubiques) est réalisée par l'analyse des données fonctionnelles , où je comprends qu'il existe des méthodes pour caractériser les différences entre les fonctions ajustées.

Mike Lawrence
la source
merci pour la suggestion que je vais examiner. Ma plus grande préoccupation est cependant la comparaison. Je pense que pour la plupart des courbes, je pourrais obtenir un ajustement décent en utilisant une variété d'approches, mais je ne sais pas comment comparer ensuite les lacs.
DQdlM
2

À titre de comparaison, il sera utile de paramétrer la relation entre l'OM (matière organique) et le SED (sédiment) de manière similaire entre les lacs - afin que vous estimiez le même modèle pour chaque lac. De cette façon, vous pouvez comparer directement les estimations de coefficient.

Si vous limitez les relations non linéaires potentielles à un polynôme d'ordre deux (quadratique), ce serait aussi simple que d'ajouter un deuxième terme à un modèle linéaire:

OM = beta_0 + beta_1 * SED + beta_2 * (SED ^ 2)

Vous pourriez alors faire un test t pour voir si les coefficients de deux lacs sont égaux ... l'un à l'autre, ou à zéro selon les questions auxquelles vous essayez de répondre.

Vous avez formulé votre question comme suit: «Je souhaite comparer les différences entre les lacs dans la relation entre le pourcentage de matière organique et la profondeur des sédiments (c.-à-d. La pente).»

Si vous formulez votre question plus précisément, cela vous aidera à choisir la bonne approche. Pourquoi la relation entre l'OM et le SED serait-elle différente d'un lac à l'autre? Y a-t-il un autre observable qui expliquerait la relation différente?

Si c'est le cas, vous voudrez peut-être inclure cette variable explicative dans votre modèle, via un terme d'interaction ou ailleurs. Sans plus d'informations sur la question spécifique à laquelle vous essayez de répondre - autre que «la relation entre l'OM et le SED est-elle la même entre les lacs? - il est difficile de suggérer une approche plus spécifique.

baha-kev
la source
1
+1. Bonne approche, bons conseils. Mais je voudrais mettre en garde contre l'utilisation d'un modèle polynomial: il est contre-indiqué par toute compréhension de la façon dont les matériaux varient au sein des sédiments. Une première coupe serait un modèle exponentiel par morceaux utilisant une procédure d'ajustement robuste. (Permettre un point de changement permet de représenter plusieurs strates discrètes de sédiments.)
whuber