Posso usare il bootstrap, perché o perché no?


10

Attualmente sto lavorando a stime di biomassa usando immagini satellitari. Definirò rapidamente lo sfondo della mia domanda, quindi spiegherò la domanda statistica su cui sto lavorando.

sfondo

Problema

Sto cercando di stimare la biomassa su un'area in Francia. La mia risposta è la densità del volume del legno di vapore (in ), che è più o meno proporzionale alla biomassa (a seconda della densità del legno ...).m3/ha

Le variabili indipendenti che ho sono indici di vegetazione derivati ​​da riflessioni misurate su quest'area (il satellite utilizzato nello studio è MODIS per coloro che lo conoscono). Questi indici sono ad esempio NDVI, EVI, ecc. Ho mappe degli indici e la risoluzione delle mappe è 250m.

Esistono forti correlazioni tra questi indici e il volume in uno stesso tipo di foresta (bioma e clima). Quindi sto cercando di regredire la densità del volume rispetto a questi indicatori (in realtà le loro serie temporali) su grafici di inventario in cui conosco il volume.

Inventari forestali

Il volume su questi grafici è stimato con il seguente metodo di campionamento:

  1. I nodi di inventario vengono posizionati su una griglia regolare che copre l'area.
  2. Un diagramma è collegato a ciascun nodo e il processo di inventario (tipi di alberi, volumi, altezza del baldacchino, ecc.) Si verifica su questo diagramma. Ovviamente sono interessato solo alla trama dell'inventario e i valori dei miei indici di vegetazione sono il valore del pixel che contiene la trama.
  3. Il processo di inventario su un diagramma è il seguente:

    http://i.stack.imgur.com/DeHdC.png

    • Misura degli alberi che hanno un diametro> 37,5 cm nel cerchio del raggio di 15 m
    • Misura degli alberi che hanno un diametro> 22,5 cm nel cerchio del raggio di 9 m
    • Misura degli alberi che hanno un diametro> 7,5 cm nel cerchio del raggio di 6 m

La densità del volume viene quindi calcolata utilizzando i fattori di espansione.

Per ogni trama ho accesso ai dati di tutti gli alberi misurati.

Inoltre, per ogni singolo albero, ho un'incertezza sul volume dovuta all'uso di equazioni allometriche (diciamo il 10%).

Dove le statistiche sono importanti ...

Affinché le mie regressioni siano più precise, per ogni stima del volume ho bisogno della varianza / CI di questa misura. Questo dipende, IMO, dal numero di alberi campionati e dalla densità del volume trovata.

Quindi ho due problemi:

  1. Come rendere conto del fatto che i miei indici di vegetazione sono misurati su un pixel di 250m?

    Posso presumere che la densità del volume sia costante su un pixel e che campiono questo pixel con un grafico dell'inventario.

  2. Come stimare la variabilità della densità del mio volume?

    Penso che potrei usare il bootstrap sulla popolazione degli alberi. Ma il mio numero totale di alberi misurati può essere piuttosto piccolo (da 7 a 20 ...). Inoltre, come posso tenere conto del fatto che sto misurando gli alberi su cerchi diversi a seconda delle loro dimensioni? E come dovrebbe cambiare la variabilità se sto osservando un intero pixel?

Stavo anche pensando che avrei potuto usare una simulazione Monte Carlo per simulare una foresta, e quindi campionare casualmente questa foresta con trame per vedere cosa sta succedendo ...

Non ho un forte background statistico, quindi sono un po 'perso!

Risposte:


1

Non capisco molto bene i tuoi dati, ma posso dirti che un'alternativa al bootstrap multinomiale che funziona meglio per eventi rari è perturbazione / bootstrap selvaggio. La perturbazione è estremamente flessibile ed è spesso in grado di gestire dati non iid, tuttavia a volte è necessaria una grande precisione per approssimare correttamente il cdf. Se riesci a specificare correttamente la formula bootstrap, effettuerai meno ipotesi e probabilmente sarai meno distorto rispetto al metodo di smoothing suggerito in precedenza, in particolare dato il tuo set di dati sparsi, che potrebbe rendere instabili le stime di densità.


0

Se dovessi affrontare questo problema, comincerei innanzitutto da:

  1. guardando una mappa dei dati di origine
  2. tentando una sorta di levigatura 2D sulla superficie, prova ad informarlo con AIC
  3. calcolare la derivata del liscio nella posizione e mettere in relazione la variazione dell'input con la variazione dell'output usando il metodo delta
  4. Confrontare i risultati di questo con alcuni valori "noti" per verificare / validare l'approccio

Link rilevanti: http://www.stanford.edu/class/cme308/notes/TaylorAppDeltaMethod.pdf http://www.ingentaconnect.com/content/klu/stco/2010/00000020/00000004/00009140?crawler=true

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.