Perché il bagging utilizza esempi bootstrap?


10

Il bagging è il processo di creazione di N studenti su N diversi campioni bootstrap, quindi prendendo la media delle loro previsioni.

La mia domanda è: perché non utilizzare qualsiasi altro tipo di campionamento? Perché usare i campioni bootstrap?

Risposte:


9

Domanda interessante. Il bootstrap ha buone proprietà di campionamento, rispetto ad alcune alternative come il coltello a serramanico. Il principale svantaggio del bootstrap è che ogni iterazione deve funzionare con un campione grande quanto il set di dati originale (che può essere computazionalmente costoso), mentre alcune altre tecniche di campionamento possono funzionare con campioni molto più piccoli.

Questo documento suggerisce che il taglio ingenuo delle dimensioni del campione può ridurre le prestazioni, relativamente al bagging basato su bootstrap, il che sarebbe un motivo per non farlo. Il documento introduce anche un nuovo metodo per utilizzare campioni più piccoli nelle stime di insaccamento, evitando al contempo tali problemi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.