Intervallo di confidenza basato su Bootstrap


17

Mentre studiavo l'intervallo di confidenza basato su bootstrap, una volta ho letto la seguente dichiarazione:

Se la distribuzione bootstrap è inclinata a destra, l'intervallo di confidenza basato su bootstrap incorpora una correzione per spostare gli endpoint ancora più a destra; questo può sembrare controintuitivo, ma è l'azione corretta.

Sto cercando di capire la logica alla base dell'affermazione di cui sopra.


Ricordi la fonte dell'affermazione? Potrebbe esserci stata qualche spiegazione lì ...
jbowman il

Risposte:


24

La domanda è correlata alla costruzione fondamentale degli intervalli di confidenza e, quando si tratta di bootstrap, la risposta dipende dal metodo di bootstrap utilizzato.

Si consideri la seguente è uno stimatore di un parametro reale valore θ con (una stima) deviazione standard se , poi un 95% intervallo di confidenza standard basato su un normale N ( θ , se 2 ) approssimazione è θθ^θseN(θ,se2) Questo intervallo di confidenza è derivato come l'insieme di θ 's che compiere z 1θ - θ z 2 dove z 1 = - 1.96 se

θ^±1.96se.
θ
z1θ^θz2
z1=1.96seè il 2,5% quantile e è il 97,5% quantile per la distribuzione N ( 0 , se 2 ) . L'osservazione interessante è che durante la sistemazione delle diseguaglianze otteniamo l'intervallo di confidenza espresso come { θ | θ - z 2θ θ - z 1 } = [ θ - Z 2 , θ - z 1 ] .z2=1.96seN(0,se2)
{θθ^z2θθ^z1}=[θ^z2,θ^z1].
Cioè, è il quantile inferiore del 2,5% che determina il punto finale destro e il quantile superiore del 97,5% che determina il punto finale sinistro .

Se la distribuzione campionaria di θ è giusto distorta rispetto alla approssimazione normale, qual è allora l'azione appropriata? Se inclinato a destra significa che il quantile del 97,5% per la distribuzione di campionamento è z 2 > 1,96 se , l'azione appropriata è spostare l'estremità sinistra più a sinistra. Cioè, se ci atteniamo alla costruzione standard sopra. Un utilizzo standard del bootstrap è quello di stimare i quantili di campionamento e quindi usarli invece di ± 1,96 se nella costruzione sopra.θ^z2>1.96se±1.96se

Tuttavia, un'altra costruzione standard utilizzato nel bootstrap rappresenta l' intervallo percentile , che è nella terminologia sopra. È semplicemente l'intervallo dal quantile 2,5% al 97,5% quantile per la distribuzione campionaria di θ . Una distribuzione campionaria destro distorta di θ implica un intervallo di confidenza destro distorta. Per i motivi sopra menzionati, questo

[θ^+z1,θ^+z2].
θ^.θ^mi sembra un comportamento controintuitivo degli intervalli percentili. Ma hanno altre virtù e sono, ad esempio, invarianti sotto trasformazioni monotone di parametri.

Gli intervalli di bootstrap BCa (corretti da bias e accelerati) introdotti da Efron, vedere ad esempio il documento Intervalli di confidenza Bootstrap , migliorano le proprietà degli intervalli percentili. Posso solo indovinare (e google) la citazione del post OP, ma forse BCa è il contesto appropriato. Citando Diciccio ed Efron dall'articolo citato, pagina 193,

un'z0φ=m(θ)φ^=m(θ^)θ

φ^~N(φ-z0σφ,σφ2),σφ=1+un'φ.
θθ^

m

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.