Questa domanda è stata posta molto tempo fa, ma sto pubblicando una risposta nel caso in cui qualcuno la scopra in futuro. In breve, la risposta è sì: è possibile farlo in molte impostazioni e si è giustificati nel correggere la modifica della dimensione del campione con . Questo approccio è di solito chiamato out of boostrap, e funziona nella maggior parte delle impostazioni del bootstrap `` tradizionale '', così come in alcune impostazioni in cui non lo fa.MN--√MN
Il motivo è che molti argomenti sulla coerenza del bootstrap usano gli stimatori della forma , dove sono variabili casuali e è un parametro di la distribuzione sottostante. Ad esempio, per la media di esempio, e .1N√( TN- μ )X1, ... , XNμTN= 1NΣNi = 1Xioμ = E ( X1)
Molte prove di coerenza del bootstrap sostengono che, come , dato un campione finito e la stima dei punti associati ,
cui sono disegnati dalla vera distribuzione sottostante e sono disegnati con la sostituzione di .N→ ∞{ x1, ... , xN}μ N = T N ( x 1 , ... , x N ) √μ^N= TN( x1, ... , xN)N--√(TN(X*1, ... ,X*N) -μ^N) →DN--√( TN( X1, ... , XN) - μ )(1)
XioX*io{ x1, ... , xN}
Tuttavia, potremmo anche usare campioni più brevi di lunghezza e considerare lo stimatore
Si scopre che, come , lo stimatore ( ) ha la stessa distribuzione limitante di cui sopra nella maggior parte delle impostazioni in cui ( ) detiene e alcuni dove non lo fa. In questo caso, ( ) e ( ) hanno la stessa distribuzione limitante, motivando il fattore di correzione ad esempio la deviazione standard del campione.M< NM--√( TM( X*1, ... , X*M) - μ^N) .(2)
M, N→ ∞112√2112MN--√
Questi argomenti sono tutti asintotici e valgono solo nel limite . Perché questo funzioni, è importante non scegliere troppo piccolo. C'è una teoria (es. Bickel e Sakov sotto) su come scegliere la ottimale in funzione di per ottenere i migliori risultati teorici, ma nel tuo caso le risorse computazionali possono essere il fattore decisivo.M, N→ ∞M M NMN
Per un po 'di intuizione: in molti casi, abbiamo come , quindi
può essere pensato un po 'come un su bootstrap con e (sto usando lettere minuscole per evitare confusione di notazione ). In questo modo, emulare la distribuzione di ( ) usando un bootstrap out of con è una cosa più `` giusta '' da fare rispetto al tradizionale ( out ofμ^N→DμN→ ∞N--√( TN( X1, ... , XN) - μ ) ,(3)
mnm = Nn = ∞3MNM< NNN) genere. Un ulteriore vantaggio nel tuo caso è che è meno costoso dal punto di vista computazionale da valutare.
Come hai detto, Politis e Romano sono i principali articoli. Trovo Bickel et al (1997) sotto una bella panoramica del bootstrap out ofMN
Fonti :
PJ Bickel, F Goetze, WR van Zwet. 1997. Ricampionamento di meno di osservazioni: guadagni, perdite e rimedi per le perdite. Statistica Sinica.n
PJ Bickel, A Sakov. 2008. Sulla scelta di nella ouf di bootstrap e la fiducia limiti per estremi. Statistica Sinica.mmn