Dove posso scaricare il database del dizionario inglese in formato testo? [chiuso]


127

Devo leggere il file di testo per una parola e restituirne il significato. Funzionerà anche qualsiasi altro formato di file.


Ho scritto un web clawler per tutti i famosi dizionari online (Oxford, Longman, Cambridge, Webster e Collins) che puoi usare per creare il tuo datset. github.com/kiasar/Dictionary_crawler
Peyman

Risposte:


62

Il progetto Gutenberg ospita il dizionario inglese integrale di Webster e molte altre opere letterarie di dominio pubblico. In realtà sembra che abbiano diverse versioni del dizionario ospitate con copyright di diversi anni. Quello che ho collegato ha un copyright del 2009. Potresti voler esplorare il sito e studiare le diverse versioni del dizionario Webster.


1
Trascrizione del '09 ripulita della versione del 1913, a quanto pare l'OCR non era completamente pulito. Ci sono un totale di 15 versioni sul sito.
DragonLord,

57

user1247808 ha un buon collegamento con: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Se questo non è abbastanza parole per te:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (URL aggiornato dal suggerimento di Michael Kropat)

Anche se il nome di quel file cambia, ti consigliamo di trovare l'ultimo ... che risulta essere solo un file di testo grande (molto grande).

http://dumps.wikimedia.org/enwiktionary/


grazie .. per questo link
AndyBoy

Puoi sempre scaricare l'ultimo wiki
Michael Kropat,

androidtech / wordnet20 è in formato SQL non txt.
DragonLord,

1
Nota: la sintassi in wordnet20 ha un TYPE deprecato = * nel file .sql. Esegui sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlper sostituire la sintassi obsoleta prima di eseguirla con una versione 5.0+ di MySQL
Serguei Fedorov

nessun semplice file txt contenente tutte le parole inglesi?
Nadav B,

27

Non so se è troppo tardi, ma ho pensato che avrebbe aiutato qualcun altro.

Volevo lo stesso male ... alla fine l'ho trovato.

Forse non è perfetto, ma per me è adeguato (per la mia piccola app per dizionari).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Non è un file di dump, ma un file di script MsQL .sql

Le parole sono nella tabella WN_SYNSET e il glossario / significato nella tabella WN_GLOSS


4
Con quale licenza è presente?
Cole Johnson,

2
Non ne sono sicuro, ma su androidtech.com/html/downloads.php c'èHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista,

7
Utenti MySQL: le istruzioni create table utilizzano l'opzione TYPE ora rimossa. Esegui questo sul file sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlper farlo funzionare nell'ultimo MySQL
anthonygore

15

Controlla se queste risorse gratuite soddisfano le tue esigenze -


8
FOLDOC (Dizionario on-line gratuito di informatica) sembra essere un dizionario di soli termini / nomi informatici. Potrebbe essere utile per alcuni, ma non è un dizionario generico in cui puoi cercare la maggior parte delle parole.
Lèse majesté,

2
Anche il link alla pagina ObjectGraph è morto. Le versioni scaricabili ufficiali si trovano qui .
Lèse majesté,

@ Lèsemajesté anche il tuo link è morto ora
yukashima huksay
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.