Stavo leggendo il materiale relativo a XGBoost. Sembra che questo metodo non richieda alcun ridimensionamento variabile poiché si basa su alberi e questo può catturare interazioni complesse con schemi di non linearità. E può gestire variabili sia numeriche sia categoriche e sembra anche che le variabili ridondanti non influiscano troppo su questo metodo.
Di solito, nella modellazione predittiva, è possibile effettuare una selezione tra tutte le funzionalità disponibili e è anche possibile creare alcune nuove funzionalità dall'insieme di funzionalità disponibili. Quindi selezionare un sottoinsieme di funzionalità significa che pensi che ci sia una ridondanza nel tuo set di funzionalità; la creazione di alcune nuove funzionalità dall'attuale set di funzionalità significa che è necessario apportare alcune trasformazioni funzionali alle funzionalità correnti. Quindi, entrambi questi due punti dovrebbero essere trattati in XGBoost. Quindi, significa che per usare XGBoost, devi solo scegliere saggiamente quei parametri di sintonizzazione? Qual è il valore di fare ingegneria delle funzionalità usando XGBoost?