Da dove provengono le parole in / usr / share / dict / words?


10

/usr/share/dict/wordscontiene molte parole. Come viene generato questo elenco? I suoi contenuti sono gli stessi tra diversi Uffici? Esiste uno standard che detta cosa deve contenere?

Finora sono riuscito a scoprire che su Ubuntu / Debian l'elenco viene dai pacchetti di elenchi di parole , ma le loro descrizioni non offrono alcun indizio su come siano stati effettivamente generati gli elenchi.

Risposte:


10

Stai ponendo più domande, ma penso che la principale sia:

Esiste uno standard che detta cosa deve contenere?

Per quanto ne so, no.

Detto questo, le tue domande correlate:

Come viene generato questo elenco? I suoi contenuti sono gli stessi tra diversi Uffici?

si risponde "dipende da ogni diverso Unix".

La convenzione di includere un elenco di parole come parte del sistema operativo viene dal l' spell(1)utility , che la utilizza per una procedura di controllo ortografico primitiva.

Tale procedura di controllo ortografico è descritta nel documento accademico "Sviluppo di una lista di ortografia", dell'MD McIlroy di Bell Labs, 1982 .

È necessario controllare il gestore dei pacchetti del sistema operativo da dove proviene l'elenco di ortografia, come viene generato e quali alternative sono disponibili.

Su Debian GNU + Linux, ad esempio:

  • Il /usr/share/dict/wordsfile è un collegamento simbolico gestito usando il sistema "alternative" di Debian.
  • Un pacchetto di elenchi di parole comuni che fornisce quel collegamento è il wamericanpacchetto.
  • La documentazione del pacchetto per gli wamericanstati il ​​suo elenco di parole proviene dal progetto SCOWL (Liste di parole orientate al controllo ortografico) .

È possibile installare molti altri pacchetti di elenchi di parole; ognuno di essi ha il campo "Fornisce: elenco di parole":

$ aptitude search '?provides(wordlist)' | wc -l
34

Su diversi Unices, dovrai vedere il sistema di pacchetti e la documentazione per conoscere la provenienza e le alternative dell'elenco di parole.


2
FWIW: In un'installazione minimale di Centos 7 x64 (dove il file di parole è assente), yum install wordsha funzionato per me.
Wossname
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.