Questa domanda è stata innescata da qualcosa che ho letto in questo manuale di statistica a livello di laurea e anche (indipendentemente) sentito durante questa presentazione in un seminario statistico. In entrambi i casi, l'affermazione era sulla falsariga di "poiché la dimensione del campione è piuttosto piccola, abbiamo deciso di eseguire la stima tramite bootstrap anziché (o insieme a) questo metodo parametrico ".
Non hanno ottenuto nei dettagli, ma probabilmente il ragionamento è il seguente: il metodo assume i dati seguono una certa parametrico di distribuzione D . In realtà la distribuzione non è esattamente D , ma va bene finché la dimensione del campione è abbastanza grande. Poiché in questo caso la dimensione del campione è troppo piccola, passiamo al bootstrap (non parametrico) che non fa ipotesi distributive. Problema risolto!
Secondo me, questo non è lo scopo di bootstrap. Ecco come lo vedo: bootstrap può dare un vantaggio quando è più o meno ovvio che ci sono abbastanza dati, ma non esiste una soluzione a forma chiusa per ottenere errori standard, valori p e statistiche simili. Un esempio classico è l'ottenimento di un elemento della configurazione per il coefficiente di correlazione dato un campione da una distribuzione normale bivariata: esiste la soluzione in forma chiusa, ma è così contorta che il bootstrap è più semplice. Tuttavia, nulla implica che bootstrap possa in qualche modo aiutare a cavarsela con una piccola dimensione del campione.
La mia percezione è giusta?
Se trovi questa domanda interessante, c'è un'altra mia domanda bootstrap più specifica:
Bootstrap: il problema del overfitting
PS Non posso fare a meno di condividere un esempio eclatante dell '"approccio bootstrap". Non sto rivelando il nome dell'autore, ma è uno dei "quants" di vecchia generazione che ha scritto un libro sulla finanza quantitativa nel 2004. L'esempio è preso da lì.
Considera il seguente problema: supponi di avere 4 risorse e 120 osservazioni di rendimento mensili per ciascuna. L'obiettivo è costruire il cdf tridimensionale congiunto dei rendimenti annuali. Anche per un singolo asset, l'attività sembra difficilmente raggiungibile con solo 10 osservazioni annuali, per non parlare della stima del cdf a 4 dimensioni. Ma non preoccuparti, il "bootstrap" ti aiuterà: prendi tutte le osservazioni a 4 dimensioni disponibili, ricampiona 12 con la sostituzione e componile per costruire un singolo vettore a 4 dimensioni "bootstrap" dei rendimenti annuali. Ripeti 1000 volte e, ecco, ti sei procurato un "campione bootstrap" di 1000 rendimenti annuali. Usalo come campione iid di dimensione 1000 ai fini della stima del cdf o qualsiasi altra inferenza che può essere ricavata da una storia millenaria.