Puis-je utiliser le bootstrap, pourquoi ou pourquoi pas?

10

Je travaille actuellement sur des estimations de biomasse utilisant l'imagerie satellite. Je vais rapidement définir l'arrière-plan de ma question, puis expliquer la question statistique sur laquelle je travaille.

Contexte

Problème

J'essaie d'estimer la biomasse sur une zone en France. Ma réponse est la densité volumique du bois de vapeur (en ), qui est plus ou moins proportionnelle à la biomasse (selon les densités de bois ...).m3/ha

Les variables indépendantes que j'ai sont des indices de végétation dérivés des réflectances mesurées sur cette zone (le satellite utilisé dans l'étude est MODIS pour ceux qui le connaissent). Ces indices sont par exemple NDVI, EVI, etc. J'ai des cartes des indices, et la résolution des cartes est de 250m.

Il existe de fortes corrélations entre ces indices et le volume dans un même type de forêt (biome et climat). J'essaie donc de régresser la densité volumique par rapport à ces indicateurs (en fait leurs séries chronologiques) sur les parcelles d'inventaire où je connais le volume.

Inventaires forestiers

Le volume de ces parcelles est estimé avec la méthode d'échantillonnage suivante:

  1. Les nœuds d'inventaire sont placés sur une grille régulière couvrant la zone.
  2. Un tracé est attaché à chaque nœud et le processus d'inventaire (types d'arbres, volumes, hauteur de la canopée, etc.) se déroule sur ce tracé. Bien sûr, je ne m'intéresse qu'à l'inventaire et la valeur de mes indices de végétation est la valeur du pixel contenant l'intrigue.
  3. Le processus d'inventaire sur un terrain est le suivant:

    http://i.stack.imgur.com/DeHdC.png

    • Mesure des arbres qui ont un diamètre> 37,5 cm dans le cercle de 15 m de rayon
    • Mesure des arbres qui ont un diamètre> 22,5 cm dans le cercle de 9 m de rayon
    • Mesure des arbres qui ont un diamètre> 7,5 cm dans le cercle de rayon de 6 m

La densité volumique est ensuite calculée à l'aide de facteurs d'expansion.

Pour chaque parcelle, j'ai accès aux données de tous les arbres mesurés.

De plus, pour chaque arbre, j'ai une incertitude sur le volume due à l'utilisation d'équations allométriques (disons 10%).

Lorsque les statistiques sont importantes ...

Pour que mes régressions soient plus précises, j'ai besoin pour chaque estimation de volume de la variance / IC de cette mesure. Cela dépend, OMI, du nombre d'arbres échantillonnés et de la densité volumique trouvée.

J'ai donc deux problèmes:

  1. Comment tenir compte du fait que mes indices de végétation sont mesurés sur un pixel de 250m?

    Je peux supposer que la densité volumique est constante sur un pixel et que j'échantillonne ce pixel avec un tracé d'inventaire.

  2. Comment estimer la variabilité de ma densité volumique?

    Je pense que je pourrais utiliser le bootstrap sur la population d'arbres. Mais mon nombre total d'arbres mesurés peut être assez petit (de 7 à 20 ...). De plus, comment puis-je prendre en compte le fait que je mesure les arbres sur différents cercles en fonction de leurs tailles? Et comment la variabilité devrait-elle changer si je regarde sur un pixel entier?

Je pensais également que je pourrais utiliser une simulation de Monte Carlo pour simuler une forêt, puis échantillonner au hasard cette forêt avec des parcelles pour voir ce qui se passe ...

Je n'ai pas un solide bagage statistique, donc je suis un peu perdu!

Thomas C.
la source

Réponses:

1

Je ne comprends pas très bien vos données, mais je peux vous dire qu'une alternative au bootstrap multinomial qui fonctionne mieux pour les événements rares est la perturbation / bootstrap sauvage. La perturbation est extrêmement flexible et est souvent capable de gérer des données non iid, mais parfois une grande finesse est nécessaire pour approximer correctement le cdf. Si vous réussissez à spécifier correctement la formule de bootstrap, vous ferez moins d'hypothèses et serez probablement moins biaisé que la méthode de lissage suggérée précédemment, en particulier compte tenu de votre jeu de données clairsemé, ce qui peut rendre les estimations de densité instables.

guest47
la source
0

Si je devais aborder ce problème, je commencerais par:

  1. regarder une carte des données source
  2. en essayant une sorte de lissage 2D sur la surface, essayez de l'informer avec AIC
  3. calculer la dérivée du lissé à l'emplacement et relier la variation de l'entrée à la variation de la sortie en utilisant la méthode delta
  4. Comparer les résultats de ceci à quelques valeurs "connues" afin de vérifier / valider l'approche

Liens pertinents: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

EngrStudent
la source