Risposta breve
I CART hanno bisogno di aiuto per catturare le interazioni.
Risposta lunga
Prendi l'esatto algoritmo avido (Chen e Guestrin, 2016):
La media sulla foglia sarà un'aspettativa condizionale, ma ogni divisione sulla strada per la foglia è indipendente dall'altra. Se la funzione A non ha importanza da sola ma è importante nell'interazione con la funzione B, l'algoritmo non si dividerà sulla funzione A. Senza questa divisione, l'algoritmo non può prevedere la divisione sulla funzione B, necessaria per generare l'interazione.
Gli alberi possono scegliere le interazioni negli scenari più semplici. Se hai un set di dati con due funzioni e target , l'algoritmo non ha nulla su cui dividere se non e , quindi otterrai quattro foglie con stimato correttamente.X1, x2y= XO R ( x1, x2)X1X2XO R
Con molte funzionalità, regolarizzazione e il limite rigido al numero di divisioni, lo stesso algoritmo può omettere le interazioni.
soluzioni alternative
Interazioni esplicite come nuove funzionalità
Un esempio di Zhang ("Winning Data Science Competitions", 2015):
Algoritmi dell'albero non avido
Nell'altra domanda, Simone suggerisce algoritmi basati su lookahead e alberi decisionali obliqui .
Un approccio di apprendimento diverso
Alcuni metodi di apprendimento gestiscono meglio le interazioni.
Ecco una tabella da The Elements of Statistical Learning (riga "Capacità di estrarre combinazioni lineari di funzionalità"):