Domande:
- Qual è la differenza (s) tra alberi di regressione potenziata (BRT) e modelli potenziati generalizzati (GBM)? Possono essere usati in modo intercambiabile? L'una è una forma specifica dell'altra?
- Perché Ridgeway ha usato la frase "Generalized Boosted Regression Models" (GBM), per descrivere ciò che Friedman aveva precedentemente proposto come "Gradient Boosting Machine" (GBM)? Questi due acronimi sono identici, descrivono la stessa cosa, ma derivano da frasi diverse.
Sfondo:
Ho difficoltà a determinare in che modo differiscono i termini BRT e GBM. Da quello che ho capito entrambi sono termini per descrivere alberi di classificazione e regressione che hanno incorporato la stocastica attraverso una sorta di potenziamento (es. Insaccamento, bootstrap, validazione incrociata). Inoltre, da quello che raccolgo il termine GBM è stato coniato per la prima volta da Friedman (2001) nel suo articolo "Approssimazione di funzioni avide: una macchina per aumentare il gradiente". Ridgeway ha quindi implementato la procedura descritta da Friedman nel 2006 nel suo pacchetto "Generalized Boosted Regression Models" (GBM). Nel mio campo (ecologia) Elith et al. (2008) è stato il primo a dimostrare il gbm
pacchetto di Ridgeway per la modellizzazione della distribuzione delle specie. Tuttavia, gli autori di Elith et al. usa il termine "albero di regressione potenziato" (BRT) per descrivere Friedman e Ridgeway "
Sono confuso sul fatto che questi termini possano essere usati in modo intercambiabile? È un po 'confuso che un autore utilizzi lo stesso acronimo (da una frase diversa) per descrivere la stessa teoria proposta da un autore precedente. È anche confuso che il terzo autore abbia usato un termine completamente diverso per descrivere questa teoria in termini ecologici.
Il meglio che posso inventare è che i BRT sono una forma specifica di GBM in cui la distribuzione è binomiale, ma non ne sono sicuro.
Elith et al. definire alberi di regressione potenziati come questo ... "Gli alberi di regressione potenziati combinano i punti di forza di due algoritmi: alberi di regressione (modelli che mettono in relazione una risposta ai loro predittori mediante divisioni binarie ricorsive) e potenziamento (un metodo adattivo per combinare molti modelli semplici per migliorare le prestazioni predittive ). Il modello BRT finale può essere inteso come un modello di regressione additiva in cui i singoli termini sono alberi semplici, montati in una maniera avanzata e graduale "(Elith et al. 2008).