C'è un risultato che fornisce che il bootstrap è valido se e solo se la statistica è liscia?


25

In tutto assumiamo che la nostra statistica sia una funzione di alcuni dati che è tratto dalla funzione di distribuzione ; la funzione di distribuzione empirica del nostro campione è . Quindi è la statistica vista come una variabile casuale e è la versione bootstrap della statistica. Usiamo come distanza KSX 1 , ... X n F F θ ( F ) θ ( F ) d θ()X1,XnFF^θ(F)θ(F^)d

Esistono risultati "if e only if" per la validità del bootstrap se la statistica è una statistica lineare semplice. Ad esempio Teorema 1 di Mammen "Quando funziona il bootstrap?"

Se per alcune funzioni arbitrarie il bootstrap funziona nel senso che se e solo se esistono e tali che Dove possiamo definire come una funzione del nostro campione ehnd[L(θ( F ) - t n),L(θ(F)-tn)]p0σntnd[L(θ(F)-tn)θ(F)=1ni1nhn(Xi)hn

d[L(θ(F^)t^n),L(θ(F)tn)]p0
σntn^ t n t n = E ( t n )
d[L(θ(F)tn),N(0,σn2)]p0
tn^tn=E(t^n)

Ci sono anche risultati più generali che il bootstrap funziona per le statistiche generali, ad esempio il Teorema 1.6.3 del Sottocampionamento di Politis Romano e Wolf:

Supponiamo che sia tratto dalla classe di tutte le distribuzioni con supporto finito. Supponiamo che la statistica sia Frechet differenziabile in rispetto alla norma e che la derivata soddisfi . Quindi \ theta (F) è asintoticamente normale e il bootstrap funziona nel senso del teorema precedente.θ ( ) F g F 0 < Var F [ g F ( x ) ] < θ ( F )Fθ()FgF0<VarF[gF(x)]<θ(F)

Vorrei una versione "se e solo se" del secondo teorema. Ciò richiederà una nozione di scorrevolezza diversa dalla differenziabilità di Frechet perché Politis, Romano e Wolf (1999) mostrano che la mediana del campione non è differenziabile da Frechet ma il bootstrap funziona ancora. Tuttavia, la mediana del campione è ancora una funzione regolare dei dati.

Ci sono alcuni commenti informali in Mammen che la scorrevolezza è necessaria:

La linearità asintotica tipicamente locale sembra essere necessaria per la coerenza del bootstrap

La citazione è di:

van Zwet, W (1989). Discorso tenuto alla conferenza su "Metodi asintotici per le procedure intensive di statistica in statistica" a Olberwolfach.

Ma non riesco a trovare traccia di questo discorso a parte una manciata di citazioni.


1
Argomento eccellente. È corretto che tutti i risultati citati siano asintotici per le dimensioni del campione che vanno all'infinito?
Michael M,

3
@Michael Grazie e sì, tutto è asintotico come . Per inciso, ci sono alcuni lavori recenti con risultati per campioni finiti (ad es. Arxiv.org/pdf/1212.6906.pdf ) ma è molto tecnico. n
orizon,

1
Argomento complicato Alcuni dicono che bootstrap non funziona in generale. van Zwer et al. dice che bisogna stare attenti a ciò che è bootstraped . Penso che si debba stabilire cosa avviare bootstrap e cosa non avviare bootstrap prima che siano giustificati ulteriori test.
Carl,

Ora ho aggiornato la risposta in risposta al commento di Mammen, spero che chiarisca ulteriormente la tua confusione. E se vuoi, puoi spiegare qualcosa sull'applicazione che ti motiva a chiedere della necessità. Questo mi aiuterà a migliorare la mia risposta.
Henry.L

Risposte:


12

(1) Perché gli stimatori non sono differenziabili da Frechet ma il loro stimatore bootstrap è ancora coerente?

È necessaria la differenziabilità Hadamard (o la differenziabilità compatta a seconda della fonte di riferimento) come condizione sufficiente per far funzionare bootstrap in quel caso, la mediana e qualsiasi quantile sono differenziabili Hadamard. La differenziazione di Frechet è troppo forte nella maggior parte delle applicazioni.

Poiché di solito è sufficiente discutere di uno spazio polacco, è necessario che un funzionale localmente lineare applichi un tipico argomento di compattezza per estendere il risultato di coerenza alla situazione globale. Vedi anche il commento di linearizzazione sotto.

ρTnn

[Shao & Tu] pagg. 85-86 illustrano situazioni in cui possono verificarsi incoerenze degli stimatori bootstrap.

FHBOOTH0

Tn

(3) Il comportamento dello stimatore bootstrap a volte dipende dal metodo utilizzato per ottenere i dati bootstrap.

K

Per quanto riguarda il commento "La linearità asintotica tipicamente locale sembra essere necessaria per la coerenza del bootstrap" fatta da Mammen come hai menzionato. Un commento di [Shao & Tu] p.78 è il seguente, in quanto hanno commentato che la linearizzazione (globale) è solo una tecnica che facilita la prova di coerenza e non indica alcuna necessità:

Zn¯=1ni=1nϕ(Xn)ϕ(X)X

Tn=θ+Zn¯+oP(1n)
TnZn¯TnZn¯{X1,,Xn}Tn
Tn=θ+Zn¯+oP(1n)
HBOOT(x)x=P{n(TnTn)x}P{n(Zn¯Zn¯)x}Zn¯

E hanno fornito un esempio 3.3 di come ottenere la coerenza bootstrap per il bootstrap di tipo MLE. Tuttavia, se la linearità globale è efficace in quel modo, è difficile immaginare come si possa dimostrare coerenza senza linearità locale. Quindi immagino che sia quello che Mammen voleva dire.

Al di là della discussione fornita da [Shao & Tu] sopra, penso che ciò che vuoi sia una condizione di caratterizzazione della coerenza degli stimatori bootstrap.

M(X)TCLT

M(X)

Odio essere cinico, ma sento ancora che questa non è la sola scrittura statistica che "cita dal vuoto". Dicendo questo, ho semplicemente la sensazione che la citazione al discorso di van Zwet sia molto irresponsabile, sebbene van Zwet sia un grande studioso.

[Wasserman] Wasserman, Larry. Tutte le statistiche non parametriche, Springer, 2010.

[Shao & Tu] Shao, Jun e Dongsheng Tu. Il coltellino e il bootstrap. Springer, 1995.

[Gine & Zinn] Giné, Evarist e Joel Zinn. "Bootstrapping misure empiriche generali." The Annals of Probability (1990): 851-869.

[Huber] Huber, Peter J. Statistiche affidabili. Wiley, 1985.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.