Wikipedia fornisce l'esempio seguente quando si descrive l' hash delle funzionalità ; ma la mappatura non sembra coerente con il dizionario definito
Ad esempio, to
dovrebbe essere convertito in 3
base al dizionario, ma è codificato come 1
invece.
C'è un errore nella descrizione? Come funziona l'hash delle caratteristiche?
I testi:
John likes to watch movies. Mary likes too. John also likes to watch football games.
può essere convertito, usando il dizionario
{"John": 1, "likes": 2, "to": 3, "watch": 4, "movies": 5, "also": 6, "football": 7, "games": 8, "Mary": 9, "too": 10}
alla matrice
[[1 2 1 1 1 0 0 0 1 1] [1 1 1 1 0 1 1 1 0 0]]