Perché i dati dovrebbero essere ricampionati sotto ipotesi nulla nei test di ipotesi bootstrap?


11

L'applicazione diretta dei metodi bootstrap ai test di ipotesi è di stimare l'intervallo di confidenza della statistica test calcolandola ripetutamente sui campioni bootstrap (Lascia che la statistica campionata da bootstrap sia chiamata ). Rifiutiamo se il parametro ipotizzato (che di solito è uguale a 0) non rientra nell'intervallo di confidenza di . θ ^ θ * H0θ0 ^ θ *θ^θ^θ^H0θ0θ^

Ho letto che questo metodo manca di energia. Nell'articolo di Hall P. e Wilson SR "Two Guidelines for Bootstrap Hypothesis Testing" (1992) è scritto come primo orientamento, che si dovrebbe ricampionare , non il . E questa è la parte che non capisco.^ θ * -θ0θ^θ^θ^θ0

Quel misura solo il pregiudizio dello stimatore ? Per gli stimatori imparziali gli intervalli di confidenza di questa espressione dovrebbero essere sempre inferiori a , ma non riesco a vedere cosa c'entri con il test per ? Non riesco a vedere da nessuna parte che mettiamo informazioni su .^ θ * ^ θ * -θ0 θ =θ0θ0θ^θ^θ^θ^θ0θ^=θ0θ0


Per quelli di voi, che non hanno accesso a questo articolo, questa è una citazione del paragrafo pertinente che viene immediatamente dopo la tesi:

Per capire perché questo è importante, osserva che il test comporterà il rifiuto di se in è "troppo grande". Se è molto lontano dal vero valore di (ovvero, se è gravemente l'errore), allora la differenza non sembrerà mai troppo grande rispetto alla distribuzione non parametrica del bootstrap di. Un confronto più significativo è con la distribuzione di. In effetti, se il vero valore di è| Θ - θ 0 | θ 0 θ H 0 | Θ - θ 0 | | Θ - θ 0 | | ^ Θ * - θ | θ θ 1 | θ 1 - θ 0 | | ^ Θ * - θ | | θ 1 - θ 0 |H0|θ^θ0|θ0θH0|θ^θ0||θ^θ0||θ^θ^|θθ1quindi la potenza del test bootstrap aumenta a 1 comeaumenta, a condizione che il test si basi sul ricampionamento , ma la potenza diminuisce al massimo al livello di significatività (come aumenta) se il test si basa sul ricampionamento |θ1θ0||θ^θ^||θ1θ0||θ^θ0|

Risposte:


7

Questo è il principio dell'analogia bootstrap. La (sconosciuta) sottostante vera distribuzione prodotto un campione a portata di mano con cdf , che a sua volta ha prodotto la statistica per alcuni funzionali . La tua idea di utilizzare il bootstrap è di fare delle dichiarazioni sulla distribuzione del campionamento basata su una distribuzione nota , dove si tenta di utilizzare un protocollo di campionamento identico (che è esattamente possibile solo per i dati iid; i dati dipendenti portano sempre a limitazioni nel modo in cui si può riprodurre accuratamente il processo di campionamento) e applicare lo stesso funzionale . L'ho dimostrato in un altro postFx1,,xnFnθ^=T(Fn)T()F~T()con (quello che penso sia) un diagramma accurato. Quindi l'analogo bootstrap della deviazione (campionamento + sistematica) , la quantità del tuo interesse centrale, è la deviazione del replicato bootstrap da ciò che è noto per la distribuzione , il processo di campionamento applicato e la funzionale , ovvero la misura della tendenza centrale è . Se hai utilizzato il bootstrap standard non parametrico con sostituzione dai dati originali, il tuo , quindi la tua misura della tendenza centrale deve essere base ai dati originali.θ^θ0θ^F~T()T(F~)F~=FnT(Fn)θ^

Oltre alla traduzione, ci sono problemi più sottili in corso con i test bootstrap che a volte sono difficili da superare. La distribuzione di una statistica test sotto il null può essere drasticamente diversa dalla distribuzione della statistica test sotto l'alternativa (ad es., Nei test sul limite dello spazio dei parametri che falliscono con il bootstrap ). I semplici test che apprendi in classi universitarie come test sono invarianti sotto turno, ma pensando: "Cavolo, ho appena spostato tutto" fallisce quando devi passare al livello successivo di complessità concettuale, i test asintotici . Pensa a questo: stai testando che e il tuo osservato . Quindi quando costruisci atχ2μ=0x¯=0.78χ2 test con l'analogo bootstrap , quindi questo test ha una non centralità incorporata di dall'inizio, invece di essere un test centrale come ci aspetteremmo. Per rendere centrale il test bootstrap, devi sottrarre la stima originale.(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2

I test sono inevitabili in contesti multivariati, che vanno da Pearson per le tabelle di contingenza al bootstrap Bollen-Stine della statistica test nei modelli di equazione strutturale. Il concetto di spostare la distribuzione è estremamente difficile da definire bene in queste situazioni ... anche se nel caso dei test sulle matrici di covarianza multivariata, ciò è possibile con una rotazione appropriata .χ2χ2


Grazie. C'è una cosa che ancora non capisco: dove inseriamo le informazioni su nel bootstrap? Dove è falso, il potrebbe essere notevolmente fuori dalla distribuzione vera. θ0H0θ0
Adam Ryczkowski il

Si calcola il valore p sotto il null, quindi si dovrebbe considerare il caso in cui conforme al null. Ovviamente vale la pena considerare l'alternativa sotto l'alternativa, ma questo è ... wow ... sarebbe un uso avanzato della metodologia di test bootstrap. θ0
StasK,

3

OK, ce l'ho. Grazie, StasK, per una risposta così buona. Terrò accettato per l'apprendimento degli altri, ma nel mio caso particolare mi mancava un fatto molto semplice:

La procedura di bootstrap secondo le linee guida di Hall & Wilson per un semplice test medio a un campione è questa (nello pseudo codice ispirato a R):

1function(data,θθ 00θ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata ^ θ *θ ^ θ *θ sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

La parte che mi è sfuggita è che stato "usato" in linea (dove abbiamo impostato il riferimento ).θθ02θ^

È interessante notare che in linea 2e 6che potremmo usare altrettanto facilmente al p.valueposto di statistic. In tal caso dovremmo anche modificare il in in linea .7


Ho votato prima, ma poi ho capito che questo non è corretto. Secondo Hall & Wilson (Sezione 2, pag. 278), è uno stimatore di , non la statistica del test come hai mostrato. Il modo in cui entra in gioco è che formiamo una distribuzione ricampionata di , quindi vediamo se sembra "estremo" rispetto alla distribuzione ricampionata. θθ0( θ * - θ )( θ -θ0)θ^θθ0(θ^θ^)(θ^θ0)
passaggio di mezzo

1
Forse utile: Michael Chernick ha fornito una concisa intuizione in risposta alla mia domanda correlata qui. stats.stackexchange.com/questions/289236/… )
mezzo passaggio
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.