Fonti dell'elenco di parole


11

Sto cercando una fonte di nomi, avverbi, aggettivi e verbi in diverse lingue.

Vorrei che le liste fossero già divise, e non dovessi passare attraverso l' OED (e equivalenti non inglesi) ricreando manualmente tali liste.

Non mi interessa davvero le definizioni e capisco che alcune parole possono essere più parti del discorso - va bene - parole come "molti" potrebbero essere un sostantivo o un aggettivo e possono apparire in entrambi gli elenchi.

Qualcuno qui conosce una tale fonte? In caso contrario, qualcuno potrebbe essere in grado di indicarmi la giusta direzione?

Sono d'accordo con il formato che è uno dei seguenti (o simile se la gente ha idee):

  • csv: <word>, noun (y/n), verb (y/n), adverb (y/n), adjective (y/n)
  • file in chiaro come "sostantivi", "verbi", ecc
  • una tabella mysql
  • eccetera

Risposte:



4

Questo potrebbe non aiutare affatto, non lo so. Ma MediaWiki ha un'API per elencare tutte le pagine appartenenti a una determinata categoria. Potresti provare ad usarlo su Wiktionary.org.

Appunti:

  • Ogni query restituisce solo 500 risultati. Tuttavia, alla fine, specifica anche un parametro da utilizzare in un'altra query per ottenere i successivi 500 risultati.
  • Include tutto nella categoria specificata, anche altre sottocategorie.
  • I risultati sembrano essere in ordine alfabetico, anche se tutto ciò che inizia con una lettera maiuscola viene prima di qualsiasi cosa in minuscolo.

Esempi:

Spero che questo aiuti, è quello che potrei inventare.


1

Seguirò il suggerimento di wordnet di @ teknikqa, ma suggerirei di dare un'occhiata alle loro API;

STORYTIME : ho avuto un corso di AI che aveva una parte di analisi del linguaggio; Ho usato le API perl del wordnet per cercare automaticamente i primi tre tipi di definizione e classificare il fraseggio da quello in tempo quasi reale END OF STORYTIME

Ci sono API disponibili per molte lingue

Cordiali saluti: Il progetto ha ottenuto un A +

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.