word2vec è una rete neurale a due livelli per elaborare il testo. Prende le parole come input e restituisce un vettore corrispondentemente. Utilizza una combinazione di Bag of Word continuo e implementazione del modello skipgram.
Qual è il modo migliore per capire la somiglianza semantica delle parole? Word2Vec va bene, ma non è l'ideale: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 …
Ho due frasi, S1 e S2, entrambe con un conteggio delle parole (di solito) inferiore a 15. Quali sono gli algoritmi più utili e di successo (machine learning), che sono probabilmente facili da implementare (la rete neurale è ok, a meno che l'architettura non sia complicata come Google Inception ecc.). …
Mi chiedo come etichettare (taggare) frasi / paragrafi / documenti con doc2vec in gensim - da un punto di vista pratico. Devi avere ogni frase / paragrafo / documento con una propria etichetta univoca (ad esempio "Sent_123")? Questo sembra utile se vuoi dire "quali parole o frasi sono più simili …
Creo un corr()df da un df originale. Il corr()df è venuto fuori 70 X 70 ed è impossibile visualizzare il heatmap ... sns.heatmap(df). Se provo a visualizzare il corr = df.corr(), la tabella non si adatta allo schermo e posso vedere tutte le correlazioni. È un modo per stampare l'intero …
Sto usando Gensim Library in Python per l'utilizzo e l'addestramento del modello word2vector. Di recente, stavo cercando di inizializzare i pesi del mio modello con alcuni modelli word2vec pre-addestrati come (modello preinstallato GoogleNewDataset). Ho avuto delle difficoltà per un paio di settimane. Ora, ho appena scoperto che in gesim esiste …
Sto cercando di trovare pesi pre-allenati di modelli già addestrati come i dati di Google News ecc. Ho trovato difficile addestrare un nuovo modello con una quantità sufficiente (10 GB ecc.) Di dati per me stesso. Quindi, voglio trarre beneficio dall'apprendimento del trasferimento in cui sarei in grado di ottenere …
Sto cercando di usare la CNN (rete neurale convoluzionale) per classificare i documenti. La CNN per brevi testi / frasi è stata studiata in molti articoli. Tuttavia, sembra che nessun documento abbia usato la CNN per lunghi testi o documenti. Il mio problema è che ci sono troppe funzioni da …
Ho letto che la rappresentazione distributiva si basa sull'ipotesi distributiva secondo cui le parole presenti in un contesto simile tendono ad avere significati simili. Word2Vec e Doc2Vec sono entrambi modellati secondo questa ipotesi. Ma, nel documento originale, anche loro sono intitolati come Distributed representation of words and phrasese Distributed representation …
Sono un principiante nelle reti neurali e attualmente sto esplorando il modello word2vec. Tuttavia, non riesco a capire quale sia esattamente la matrice delle caratteristiche. Posso capire che la prima matrice è un vettore di codifica one-hot per una determinata parola, ma cosa significa la seconda matrice? Più specificamente, cosa …
Ho letto la spiegazione della convoluzione e la capisco fino a un certo punto. Qualcuno può aiutarmi a capire come questa operazione si collega alla convoluzione nelle reti neurali convoluzionali? È una funzione simile a un filtro gche applica peso?
Sto cercando di fare un'analisi del sentiment. Per convertire le parole in vettori di parole sto usando il modello word2vec. Supponiamo che io abbia tutte le frasi in un elenco chiamato "frasi" e le sto passando a word2vec come segue: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Dato …
Ho lavorato su dati addestrati per l'algoritmo Word2vec. Dato che abbiamo bisogno di parole per rimanere come originali, non le rendiamo minuscole nella fase di preelaborazione. Quindi ci sono parole con diverse varianti (ad esempio "Terra" e "terra"). L'unico modo in cui riesco a pensare è prendere la media dei …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.