Domande taggate «tokenize»


16
Analizzare (dividere) una stringa in C ++ usando il delimitatore di stringa (standard C ++)
Sto analizzando una stringa in C ++ usando quanto segue: using namespace std; string parsed,input="text to be parsed"; stringstream input_stringstream(input); if (getline(input_stringstream,parsed,' ')) { // do some processing. } L'analisi con un singolo delimitatore di caratteri va bene. E se volessi usare una stringa come delimitatore. Esempio: voglio dividere: scott>=tiger …
363 c++  parsing  split  token  tokenize 



10
Scanner vs. StringTokenizer vs. String.Split
Ho appena imparato a conoscere la classe Scanner di Java e ora mi chiedo come si confronta / compete con StringTokenizer e String.Split. So che StringTokenizer e String.Split funzionano solo su stringhe, quindi perché dovrei usare lo scanner per una stringa? Scanner è pensato per essere lo sportello unico per …


5
Una riga di codice Python può conoscere il suo livello di annidamento del rientro?
Da qualcosa del genere: print(get_indentation_level()) print(get_indentation_level()) print(get_indentation_level()) Vorrei ottenere qualcosa del genere: 1 2 3 Il codice può leggere se stesso in questo modo? Tutto quello che voglio è che l'output delle parti più nidificate del codice sia più nidificato. Allo stesso modo in cui ciò semplifica la lettura del …


11
Come sbarazzarsi della punteggiatura usando il tokenizer NLTK?
Sto appena iniziando a usare NLTK e non capisco come ottenere un elenco di parole dal testo. Se uso nltk.word_tokenize(), ottengo un elenco di parole e punteggiatura. Mi servono invece solo le parole. Come posso eliminare la punteggiatura? Inoltre word_tokenizenon funziona con più frasi: i punti vengono aggiunti all'ultima parola.
125 python  nlp  tokenize  nltk 

13
Divisione della stringa in più righe in Oracle
So che a questo è stato risposto in una certa misura con PHP e MYSQL, ma mi chiedevo se qualcuno potesse insegnarmi l'approccio più semplice per dividere una stringa (delimitata da virgole) in più righe in Oracle 10g (preferibilmente) e 11g. La tabella è la seguente: Name | Project | …
104 sql  string  oracle  plsql  tokenize 
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.