Domande taggate «nlp»

L'elaborazione del linguaggio naturale (PNL) è un sottocampo dell'intelligenza artificiale che implica la trasformazione o l'estrazione di informazioni utili dai dati del linguaggio naturale. I metodi includono l'apprendimento automatico e approcci basati su regole.



10
PNL Java Stanford: parte delle etichette vocali?
La PNL di Stanford, qui dimostrata , fornisce un output come questo: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Che cosa significano i tag di Parte del discorso? Non riesco a trovare un elenco ufficiale. È il sistema di Stanford o usano tag universali? (Cos'è JJ, per esempio?) Inoltre, quando sto …

15
Rilevare sillabe in una parola
Devo trovare un modo abbastanza efficace per rilevare sillabe in una parola. Per esempio, Invisibile -> in-vi-sib-le Esistono alcune regole di sillabazione che potrebbero essere utilizzate: V CV VC CVC CCV CCCV CVCC * dove V è una vocale e C è una consonante. Per esempio, Pronuncia (5 Pro-suora-ci-a-zione; CV-CVC-CV-V-CVC) …



11
Come sbarazzarsi della punteggiatura usando il tokenizer NLTK?
Sto appena iniziando a usare NLTK e non capisco come ottenere un elenco di parole dal testo. Se uso nltk.word_tokenize(), ottengo un elenco di parole e punteggiatura. Mi servono invece solo le parole. Come posso eliminare la punteggiatura? Inoltre word_tokenizenon funziona con più frasi: i punti vengono aggiunti all'ultima parola.
125 python  nlp  tokenize  nltk 


2
Java o Python per l'elaborazione del linguaggio naturale [chiuso]
Chiuso . Questa domanda è basata sull'opinione . Attualmente non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che possa essere risolta con fatti e citazioni modificando questo post . Chiuso 6 anni fa . Migliora questa domanda Vorrei sapere quale linguaggio di programmazione è migliore per …
112 java  python  nlp 

21
Come si esprimono le parole o le lemmatizzazioni?
Ho provato PorterStemmer e Snowball ma entrambi non funzionano su tutte le parole, mancandone alcune molto comuni. Le mie parole di prova sono: " gatti che corrono gestivano cactus, cactus, comunità di cactus ", ed entrambi hanno meno della metà di ragione. Guarda anche: Algoritmo di stemming che produce parole …


3
Come addestrare lo Stanford Parser con Genia Corpus?
Ho alcuni problemi a creare un nuovo modello per Stanford Parser. Ho anche scaricato l'ultima versione da Stanford: http://nlp.stanford.edu/software/lex-parser.shtml E qui, Genia Corpus in 2 formati, xml e ptb (Penn Treebank). Standford Parser può eseguire l'addestramento con file ptd; poi ho scaricato Genia Corpus, perché voglio lavorare con testo biomedico: …
93 java  nlp  stanford-nlp 




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.