Come ho sentito parlare del classificatore AdaBoost più volte menzionato al lavoro, volevo avere un'idea migliore di come funziona e quando si potrebbe desiderare di usarlo. Sono andato avanti e ho letto una serie di articoli e tutorial che ho trovato su Google, ma ci sono aspetti del classificatore che non riesco ancora a capire:
La maggior parte dei tutorial che ho visto parlano di AdaBoost come trovare la migliore combinazione ponderata di molti classificatori. Questo ha senso per me. Ciò che non ha senso sono le implementazioni (cioè MALLET) in cui AdaBoost sembra accettare solo uno studente debole. Che senso ha questo? Se ad AdaBoost viene fornito un solo classificatore, non dovrebbe semplicemente restituire lo stesso classificatore con un peso di 1? Come produce nuovi classificatori dal primo classificatore?
Quando si vorrebbe effettivamente utilizzare AdaBoost? Ho letto che dovrebbe essere uno dei migliori classificatori out-of-the-box, ma quando provo a potenziare un classificatore MaxEnt stavo ottenendo punteggi f del 70% + con, AdaBoost lo uccide e mi dà f- decine di qualcosa come il 15% con un richiamo molto elevato e una precisione molto bassa. Quindi ora sono confuso. Quando mai vorrei usare AdaBoost? Sto cercando una risposta più intuitiva piuttosto che strettamente statistica, se possibile.