Quali sono i metodi utilizzati dagli algoritmi di apprendimento dell'albero decisionale per gestire i valori mancanti.
Semplicemente riempiono lo slot usando un valore chiamato missing?
Grazie.
Quali sono i metodi utilizzati dagli algoritmi di apprendimento dell'albero decisionale per gestire i valori mancanti.
Semplicemente riempiono lo slot usando un valore chiamato missing?
Grazie.
Risposte:
Esistono diversi metodi utilizzati da vari alberi decisionali. Ignorare semplicemente i valori mancanti (come fa ID3 e altri vecchi algoritmi) o trattare i valori mancanti come un'altra categoria (nel caso di una caratteristica nominale) non è reale gestire i valori mancanti. Tuttavia, tali approcci sono stati utilizzati nelle prime fasi dello sviluppo dell'albero decisionale.
Gli approcci di gestione reali ai dati mancanti non utilizzano il punto dati con valori mancanti nella valutazione di una suddivisione. Tuttavia, quando i nodi figlio vengono creati e formati, tali istanze vengono distribuite in qualche modo.
Conosco i seguenti approcci per distribuire le istanze di valore mancanti ai nodi figlio: