Ho dati grezzi che hanno circa 20 colonne (20 funzionalità). Dieci sono dati continui e 10 sono categorici. Alcuni dei dati categorici possono avere circa 50 valori diversi (Stati Uniti). Dopo aver preelaborato i dati, le 10 colonne continue diventano 10 colonne preparate e i 10 valori categorici diventano come 200 variabili con codifica a caldo. Sono preoccupato che se inserissi tutte queste funzionalità 200 + 10 = 210 nella rete neurale, le funzionalità 200 one (le 10 colonne categoriche) domineranno totalmente le funzionalità 10 continue.
Forse un metodo sarebbe quello di "raggruppare" colonne o qualcosa del genere. Si tratta di una preoccupazione valida e esiste un modo standard di affrontare questo problema?
(Sto usando Keras, anche se non penso che importi molto.)