Comprensione dell'output di un bootstrap eseguito in R (tsboot, MannKendall)


11

Ho una domanda sull'interpretazione della chiamata tsboot in R. Ho controllato la documentazione di Kendall e del pacchetto di avvio, ma non sono più intelligente di prima.

Quando eseguo un bootstrap usando ad esempio l'esempio nel pacchetto Kendall, dove la statistica del test è la tau di Kendall:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

che conferma la tendenza al rialzo:

tau = 0.265, 2-sided pvalue =0.00029206

L'esempio continua quindi a utilizzare un bootstrap a blocchi:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Ricevo il seguente risultato:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Se ho capito bene, il "t1 * originale" è il MKtau originale, il "bias" è la media del MKtau dalle serie temporali avviate R = 500 e l '"errore standard" è la deviazione standard del MKtau da i 500 campioni.

Ho difficoltà a capire cosa significhi - questo in sostanza mi dice che tutti i 500 MKTaus sono inferiori rispetto all'originale e che l'originale t1 * è nell'intervallo di 3 sd del MKtaus avviato dal bootstrap. Ergo è significativamente diverso?

O direi che il MKtau per il set di dati è 0,26 più / meno errore standard?

Mi dispiace per la lunga domanda, ma sono un novizio di statistica e sto imparando tramite lo studio autonomo, mancando a qualcuno di rimbalzare avanti e indietro questo problema probabilmente molto semplice.


6
Nell'output biasè semplicemente la differenza tra la media dei 500 campioni di bootstrap memorizzati e la stima originale. La std. errorè la deviazione standard dei campioni di bootstrap 500 ed è una stima dell'errore standard. L'output ti dice che la tua stima originale è superiore alla media delle 500 stime bootstrap (quindi non tutti i MKtaus bootstrap sono inferiori). Il bootstrap viene spesso utilizzato per calcolare errori standard / intervalli di confidenza senza fare ipotesi sulla distribuzione. Utilizzare la boot.cifunzione per calcolare gli intervalli di confidenza.
COOLSerdash,

@COOLSerdash, grazie per questo! Quindi, se la mia statistica originale è 3 sd più alta della media della statistica bootstrap, posso quindi concludere qualcosa direttamente (diciamo: la statistica è significativa a 0,99)? Ho anche usato il boot.ciper calcolare gli intervalli di confidenza e, di nuovo, la statistica inizialmente calcolata si trova al di fuori di questi intervalli.
Maria,

No, non si confronta la statistica bootstrap con la statistica originale con un test di ipotesi. Vorrei solo utilizzare / segnalare l'errore standard bootstrap e gli intervalli di confidenza nel tuo caso.
COOLSerdash,

Risposte:


3

Avendo incontrato la stessa domanda ed esplorato con un set di dati controllato - modello y = ax + b con errori N (0, sig), trovo che il pacchetto Kendall potrebbe non funzionare come pubblicizzato. La x nel mio caso era 1:100, e y = x , con sig = 100 (varianza del termine di errore).

La regressione sembra buona, così come la tau di Kendall. Qui non esiste autocorrelazione oltre a quella indotta dal modello lineare. L'esecuzione del test Kendall come pubblicizzato con lunghezze di blocco di 1, 3, 5 e 10 produce valori di polarizzazione molto grandi e boot.cinon riporta alcuna tendenza.

Successivamente, ho codificato manualmente il bootstrap dei dati con queste lunghezze di blocco e con le mie serie di controllo, ho ottenuto risultati ragionevoli sulla media dei campioni bootstrap e sulla loro diffusione. Quindi, è possibile che qualcosa sia andato storto con il pacchetto Kendall per quanto riguarda il blocco bootstrap.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.