Stavo lavorando sul modello gensim di word2vec e l'ho trovato davvero interessante. Sono interessato a scoprire come una parola sconosciuta / invisibile, se verificata con il modello, sarà in grado di ottenere termini simili dal modello addestrato.
È possibile? Word2Vec può essere ottimizzato per questo? O il corpus di formazione deve avere tutte le parole di cui voglio trovare la somiglianza.