C'è un iter
parametro nell'implementazione di gensim
Word2Vec
class gensim.models.word2vec.Word2Vec (frasi = None, size = 100, alpha = 0.025, window = 5, min_count = 5, max_vocab_size = None, sample = 0, seed = 1, operai = 1, min_alpha = 0.0001, sg = 1, hs = 1, negativo = 0, cbow_mean = 0, hashfxn =, iter = 1 , null_word = 0, trim_rule = None, ordinati_vocab = 1)
che specifica il numero di epoche, ovvero:
iter = numero di iterazioni (epoche) sul corpus.
Qualcuno sa se questo aiuta a migliorare il modello sul corpus?
C'è qualche motivo per cui l' iter
impostazione predefinita è 1? Non c'è molto effetto nell'aumentare il no. di epoche?
Esiste una valutazione scientifica / empirica su come impostare il no. di epoche?
A differenza dell'attività di classificazione / regressione, il metodo di ricerca della griglia non funzionerebbe davvero poiché i vettori sono generati in modo non supervisionato e la funzione obiettivo è semplicemente tramite softmax gerarchico o campionamento negativo.
Esiste un meccanismo di arresto anticipato per ridurre il no. di epoche in cui convergono i vettori? E possono convergere la softmax gerarchica o l'obiettivo di campionamento negativo?