Foreste casuali online aggiungendo più alberi delle decisioni singoli


13

Una foresta casuale (RF) è creata da un insieme di Decision Trees (DT). Utilizzando il bagging, ogni DT viene addestrato in un sottoinsieme di dati diverso. Quindi, esiste un modo per implementare una foresta casuale in linea aggiungendo ulteriori decisioni su nuovi dati?

Ad esempio, abbiamo 10K campioni e addestriamo 10 DT. Quindi otteniamo campioni da 1K e invece di addestrare di nuovo l'intera RF, aggiungiamo un nuovo DT. La previsione viene fatta ora dalla media bayesiana di 10 + 1 DT.

Inoltre, se conserviamo tutti i dati precedenti, i nuovi DT possono essere formati principalmente sui nuovi dati, in cui la probabilità di prelevare un campione viene ponderata a seconda di quante volte sono già stati raccolti.

Risposte:


8

C'è un recente articolo su questo argomento ( foreste casuali online ), proveniente dalla visione artificiale. Ecco un'implementazione e una presentazione: foreste casuali online in 10 minuti


L'implementazione che hai citato segue una strategia di crescita degli alberi, come le foreste di Mondrian ( arxiv.org/abs/1406.2673 ). Quindi, il numero di alberi è costante mentre aumenta il numero di divisioni. La mia domanda si concentra sull'aumento del numero di alberi per i nuovi campioni, pur rimanendo intatti gli alberi precedentemente formati.
tashuhka,

1
Come questo ? Non vuoi anche far cadere gli alberi se è il caso?
Emre,

Grazie. Questo è più simile a quello che sto cercando. In questo caso, utilizzare RF per la selezione della funzione dei segnali di variazione del tempo. Tuttavia, l'implementazione e la validità specifiche del metodo non sono chiare, sai se hanno pubblicato qualcosa (Google non ha aiutato)?
tashuhka,


Grazie per il link! Vedo che in realtà aggiornano tutti gli alberi precedenti usando una strategia di crescita degli alberi e sono interessato a creare nuovi DT con i nuovi dati mantenendo intatti i vecchi alberi.
tashuhka,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.