Esistono diversi modi in cui è possibile applicare il bootstrap. I due approcci più elementari sono quelli che sono considerati bootstrap "non parametrici" e "parametrici". Il secondo presuppone che il modello che stai utilizzando sia (essenzialmente) corretto.
Concentriamoci sul primo. Si suppone che si dispone di un campione casuale X1,X2,…,Xn distribuito in base alla funzione di distribuzione F . (Supponendo che altrimenti richiede approcci modificati.) Sia F n ( x ) = n - 1 Σ n i = 1 1 ( X i ≤ x ) è la funzione di ripartizione empirica. Gran parte della motivazione per il bootstrap deriva da un paio di fatti.F^n(x)=n−1∑ni=11(Xi≤x)
Disuguaglianza di Dvoretzky – Kiefer – Wolfowitz
P(supx∈R|F^n(x)−F(x)|>ε)≤2e−2nε2.
Ciò mostra che la funzione di distribuzione empirica converge uniformemente alla vera funzione di distribuzione esponenzialmente veloce nella probabilità. In effetti, questa disuguaglianza unita al lemma di Borel – Cantelli mostra immediatamente che quasi sicuramente.supx∈R|F^n(x)−F(x)|→0
Non ci sono condizioni aggiuntive sulla forma di per garantire questa convergenza.F
Euristicamente, quindi, se siamo interessati a qualche funzionale della funzione di distribuzione che è liscia , allora ci aspettiamo che sia vicino a .T(F)T(F^n)T(F)
(Punto di vista) Sfarzosità diF^n(x)
Per semplice linearità di aspettativa e definizione di , per ogni ,F^n(x)x∈R
EFF^n(x)=F(x).
Supponiamo di essere interessati alla media . Quindi l'imparzialità della misura empirica si estende all'imparzialità dei funzionali lineari della misura empirica. Quindi,
μ=T(F)
EFT(F^n)=EFX¯n=μ=T(F).
Quindi è corretto in media e poiché sta rapidamente avvicinando a , quindi (euristicamente), si avvicina rapidamente a .T(F^n)Fn^FT(F^n)T(F)
Per costruire un intervallo di confidenza ( che è, essenzialmente, ciò di cui tratta il bootstrap ), possiamo usare il teorema del limite centrale, la coerenza dei quantili empirici e il metodo delta come strumenti per passare da semplici funzionali lineari a statistiche di interesse più complicate .
Buone referenze sono
- B. Efron, metodi Bootstrap: un altro sguardo al coltello a serramanico , Ann. Statistica. , vol. 7, n. 1, 1–26.
- B. Efron e R. Tibshirani, An Introduction to the Bootstrap , Chapman – Hall, 1994.
- GA Young e RL Smith, Essentials of Statistical Inference , Cambridge University Press, 2005, capitolo 11 .
- AW van der Vaart, Statistica asintotica , Cambridge University Press, 1998, capitolo 23 .
- P. Bickel e D. Freedman, Qualche teoria asintotica per il bootstrap . Ann. Statistica. , vol. 9, n. 6 (1981), 1196–1217.