Ho un set di dati con un set di funzionalità. Alcuni di essi sono binari attivo o attivato, inattivo o inattivo) e il resto ha un valore reale, ad esempio .
Voglio fornire questi dati a un algoritmo di apprendimento automatico, quindi ho eseguito il punteggio tutte le funzionalità con valori reali. Le ottengo tra gli intervalli e approssimativamente. Ora anche i valori binari hanno un punteggio , quindi gli zeri diventano e quelli diventano .
Ha senso standardizzare le variabili binarie come questa?