Sto leggendo questo libro ( NLTK ) ed è confuso. L'entropia è definita come : L'entropia è la somma della probabilità di ciascuna etichetta per la probabilità di registro di quella stessa etichetta Come posso applicare l' entropia e l'entropia massima in termini di mining del testo? Qualcuno può darmi …
Quando si tenta di caricare il punkttokenizer ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a è LookupErrorstato sollevato: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - …
Sto cercando un modo per dividere un testo in n-grammi. Normalmente farei qualcosa del tipo: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Sono consapevole che nltk offre solo bigrammi e trigrammi, ma c'è un modo per dividere …
Voglio controllare in un programma Python se una parola è nel dizionario inglese. Credo che l'interfaccia wordl di nltk potrebbe essere la strada da percorrere, ma non ho idea di come usarla per un compito così semplice. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) In futuro, potrei …
Sto appena iniziando a usare NLTK e non capisco come ottenere un elenco di parole dal testo. Se uso nltk.word_tokenize(), ottengo un elenco di parole e punteggiatura. Mi servono invece solo le parole. Come posso eliminare la punteggiatura? Inoltre word_tokenizenon funziona con più frasi: i punti vengono aggiunti all'ultima parola.
Quindi ho un set di dati che vorrei rimuovere dall'uso delle parole di arresto stopwords.words('english') Sto lottando su come usarlo nel mio codice per estrarre semplicemente queste parole. Ho già un elenco delle parole da questo set di dati, la parte con cui sto lottando è il confronto con questo …
Nello script di shell sto controllando se questi pacchetti sono installati o meno, se non installati, installalo. Quindi con lo script di shell: import nltk echo nltk.__version__ ma ferma lo script di shell a import riga nel terminale linux ha provato a vedere in questo modo: which nltk che non …
Ho difficoltà a usare pip per installare quasi tutto. Sono nuovo nella programmazione, quindi ho pensato che forse questo è qualcosa che ho sbagliato e ho scelto easy_install per ottenere la maggior parte di ciò di cui avevo bisogno, che generalmente ha funzionato. Tuttavia, ora sto cercando di scaricare la …
Stavo seguendo un tutorial che era disponibile nella Parte 1 e nella Parte 2 . Sfortunatamente l'autore non ha avuto il tempo per la sezione finale che prevedeva l'uso della somiglianza del coseno per trovare effettivamente la distanza tra due documenti. Ho seguito gli esempi nell'articolo con l'aiuto del seguente …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.