Prima di tutto: da quello che ho capito, i residui del bootstrap funzionano come segue:
- Adatta il modello ai dati
- Calcola i residui
- Ricampiona i residui e aggiungili a 1.
- Adatta il modello al nuovo set di dati da 3.
- Ripetere i
n
tempi, ma aggiungere sempre i residui ricampionati all'adattamento da 1.
È corretto finora?
Quello che voglio fare è qualcosa di leggermente diverso:
Voglio stimare l'incertezza dei parametri e delle previsioni per un algoritmo che stima alcune variabili ambientali.
Quello che ho è una serie temporale priva di errori (da una simulazione) di quella variabile x_true
, a cui aggiungo un po 'di rumore x_noise
, al fine di generare un set di dati sintetico x
. Provo quindi a trovare i parametri ottimali adattando il mio algoritmo con la somma dei quadrati sum((x_estimate - x_true)^2)
(! Non x_estimate - x
!) Come funzione oggettiva. Per vedere come funziona il mio algoritmo e creare campioni delle distribuzioni dei miei parametri, voglio ricampionare x_noise
, aggiungerlo a x_true
, adattare di nuovo il mio modello, sciacquare e ripetere. È un approccio valido per valutare l'incertezza dei parametri? Posso interpretare gli adattamenti ai set di dati avviati come boot boot come incertezza di previsione o devo seguire la procedura che ho pubblicato sopra?
/ modifica: penso di non aver chiarito cosa fa il mio modello. Pensalo essenzialmente come un metodo di de-noising. Non è un modello predittivo, è un algoritmo che tenta di estrarre il segnale sottostante di una serie temporale rumorosa di dati ambientali.
/ edit ^ 2: Per gli utenti MATLAB là fuori, ho scritto un esempio di regressione lineare rapida e sporca di ciò che intendo.
Questo è quello che credo sia il bootstrap "ordinario" dei residui (per favore correggimi se sbaglio): http://pastebin.com/C0CJp3d1
Questo è quello che voglio fare: http://pastebin.com/mbapsz4c