Sto scrivendo un programma che ha bisogno di MOLTE parole della lingua inglese. Sto cercando di trovare un file di dizionario che contiene molte parole. Qualcuno sa di una buona fonte? Ho provato molte fonti ma non sembrano averlo.
Sto scrivendo un programma che ha bisogno di MOLTE parole della lingua inglese. Sto cercando di trovare un file di dizionario che contiene molte parole. Qualcuno sa di una buona fonte? Ho provato molte fonti ma non sembrano averlo.
Risposte:
Che dire di /usr/share/dict/words
qualsiasi sistema Unix? Di quante parole stiamo parlando? Come OED-Unabridged?
cat /usr/share/dict/words > words.txt
tutte le cose !
sudo apt-get install wbritish
Per un file .txt del dizionario inglese, è possibile utilizzare il dizionario personalizzato .
Puoi anche generare un aspell elenco o un elenco di parole con le proprie impostazioni.
Inoltre puoi dare un'occhiata a http://wordlist.sourceforge.net/
Solo parole inglesi: http://www.math.sjsu.edu/~foster/dictionary.txt
Dai anche un'occhiata a:
95 (insane)
3 (seldom used)
Strip
fornisce circa 675.000 parole.
http://www.math.sjsu.edu/~foster/dictionary.txt
350.000 parole
Molto tardi, ma potrebbe essere utile per gli altri.
C'è anche WordNet . Il formato dei file di dati è ben documentato.
L'ho usato per creare una libreria di dizionari incorporabile per sviluppatori iOS ( www.lexicontext.com ) e anche in una delle mie app.
@ Ricercatori futuri: puoi usare aspell per fare i controlli del dizionario, ha legami in rubino e pitone. Renderebbe il tuo lavoro molto più semplice.