Sto costruendo un modello e penso che la posizione geografica probabilmente sarà molto brava a prevedere la mia variabile target. Ho il codice postale di ciascuno dei miei utenti. Non sono del tutto sicuro del modo migliore per includere il codice postale come funzione predittiva nel mio modello. Sebbene il codice postale sia un numero, non significa nulla se il numero aumenta o diminuisce. Potrei binarizzare tutti i 30.000 codici postali e includerli come funzioni o nuove colonne (ad es. {User_1: {61822: 1, 62118: 0, 62444: 0, ecc.}}. Tuttavia, sembra che aggiungerebbe un sacco di funzionalità per il mio modello.
Qualche idea sul modo migliore per gestire questa situazione?