Salve, ho un frame di dati con valori categorici elevati su oltre 1600 categorie, esiste un modo per trovare alternative in modo da non avere più di 1600 colonne.
Ho trovato questo link interessante sotto http://amunategui.github.io/feature-hashing/#sourcecode
Ma si stanno convertendo in classe / oggetto che non voglio. Voglio il mio output finale come frame di dati in modo da poter testare con diversi modelli di machine learning? o c'è un modo in cui posso usare la matrice genetrata per addestrare altri modelli di machine learning diversi dalla regressione logistica o XGBoost?
Posso comunque implementare?