Supponiamo che abbiamo un problema di classificazione binaria con caratteristiche per lo più categoriche. Usiamo alcuni modelli non lineari (ad esempio XGBoost o Random Forests) per impararlo.
- Bisogna ancora preoccuparsi della multi-collinearità? Perché?
- Se la risposta a quanto sopra è vera, come si dovrebbe combatterla considerando che si stanno usando questi tipi di modelli non lineari?