Alcune tecniche di modellazione predittiva sono più progettate per gestire predittori continui, mentre altre sono migliori per gestire variabili categoriche o discrete. Naturalmente esistono tecniche per trasformare un tipo in un altro (discretizzazione, variabili fittizie, ecc.). Tuttavia, esistono delle tecniche di modellazione predittiva progettate per gestire entrambi i tipi di input contemporaneamente senza semplicemente trasformare il tipo di funzionalità? In tal caso, queste tecniche di modellazione tendono a funzionare meglio sui dati per i quali si adattano meglio?
La cosa più vicina che conosco sarebbe che di solito gli alberi decisionali gestiscono bene i dati discreti e gestiscono i dati continui senza richiedere una discretizzazione anticipata . Tuttavia, questo non è proprio quello che stavo cercando poiché in realtà le divisioni sulle funzionalità continue sono solo una forma di discretizzazione dinamica.
Per riferimento, ecco alcune domande correlate, non duplicate:
- Come devono essere implementate le suddivisioni dell'albero decisionale quando si prevedono variabili continue?
- Posso usare la regressione multipla quando ho misurato predittori categorici e continui?
- Ha mai senso trattare i dati categorici come continui?
- Analisi continua e categorica dei dati variabili