Domande taggate «nltk»

Il Natural Language Toolkit è una libreria Python per la linguistica computazionale.


15
Impossibile caricare english.pickle con nltk.data.load
Quando si tenta di caricare il punkttokenizer ... import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') ... a è LookupErrorstato sollevato: > LookupError: > ********************************************************************* > Resource 'tokenizers/punkt/english.pickle' not found. Please use the NLTK Downloader to obtain the resource: nltk.download(). Searched in: > - 'C:\\Users\\Martinos/nltk_data' > - 'C:\\nltk_data' > - 'D:\\nltk_data' > - …
144 python  jenkins  nltk 


15
n-grammi in pitone, quattro, cinque, sei grammi?
Sto cercando un modo per dividere un testo in n-grammi. Normalmente farei qualcosa del tipo: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Sono consapevole che nltk offre solo bigrammi e trigrammi, ma c'è un modo per dividere …
137 python  string  nltk  n-gram 

9
Come verificare se una parola è una parola inglese con Python?
Voglio controllare in un programma Python se una parola è nel dizionario inglese. Credo che l'interfaccia wordl di nltk potrebbe essere la strada da percorrere, ma non ho idea di come usarla per un compito così semplice. def is_english_word(word): pass # how to I implement is_english_word? is_english_word(token.lower()) In futuro, potrei …
134 python  nltk  wordnet 


11
Come sbarazzarsi della punteggiatura usando il tokenizer NLTK?
Sto appena iniziando a usare NLTK e non capisco come ottenere un elenco di parole dal testo. Se uso nltk.word_tokenize(), ottengo un elenco di parole e punteggiatura. Mi servono invece solo le parole. Come posso eliminare la punteggiatura? Inoltre word_tokenizenon funziona con più frasi: i punti vengono aggiunti all'ultima parola.
125 python  nlp  tokenize  nltk 

12
Come rimuovere le parole chiave usando nltk o python
Quindi ho un set di dati che vorrei rimuovere dall'uso delle parole di arresto stopwords.words('english') Sto lottando su come usarlo nel mio codice per estrarre semplicemente queste parole. Ho già un elenco delle parole da questo set di dati, la parte con cui sto lottando è il confronto con questo …
110 python  nltk  stop-words 


26
problema con pip installando quasi tutte le librerie
Ho difficoltà a usare pip per installare quasi tutto. Sono nuovo nella programmazione, quindi ho pensato che forse questo è qualcosa che ho sbagliato e ho scelto easy_install per ottenere la maggior parte di ciò di cui avevo bisogno, che generalmente ha funzionato. Tuttavia, ora sto cercando di scaricare la …
101 python  pip  nltk  easy-install 

17
Risorsa u'tokenizers / punkt / english.pickle 'non trovata
Il mio codice: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') Messaggio di errore: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load opened_resource = _open(resource_url) File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open return find(path_, path + ['']).open() File …
96 python  unix  nltk 



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.