Strumento per misurare la leggibilità del testo inglese


13

Esiste un programma da riga di comando che prende un file contenente testo inglese, analizza il testo e genera i suoi punteggi di leggibilità?

Ad esempio, se si fornisce al programma un testo, il programma dovrebbe generare il livello di valutazione Flesch-Kincaid, la classificazione SMOG di McLaughlin, ecc.

Credo che un simile programma esista nei repository ufficiali, ma non ricordo il suo nome. C'è anche la possibilità che io stia agendo male.

Risposte:


11

Il diction Installa dizionepacchetto contiene uno strumento chiamato style:

Style analizza le caratteristiche superficiali dello stile di scrittura di un documento. Stampa vari gradi di leggibilità, lunghezza delle parole, frasi e paragrafi. Può localizzare ulteriormente frasi con determinate caratteristiche.

Ad esempio, se valuto il corpo della domanda (salvato in un file flux_question) per stampare le frasi con un indice di leggibilità (ARI) superiore a 10:

$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
        Kincaid: 10.2
        ARI: 10.8
        Coleman-Liau: 12.5
        Flesch Index: 51.1/100
        Fog Index: 12.0
        Lix: 48.6 = school year 9
        SMOG-Grading: 11.2
sentence info:
        333 characters
        65 words, average length 5.12 characters = 1.65 syllables
        4 sentences, average length 16.2 words
        25% (1) short sentences (at most 11 words)
        0% (0) long sentences (at least 26 words)
        1 paragraphs, average length 4.0 sentences
        25% (1) questions
        25% (1) passive sentences
        longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
        verb types:
        to be (1) auxiliary (2) 
        types as % of total:
        conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
        nominalizations 0% (0)
sentence beginnings:
        pronoun (1) interrogative pronoun (0) article (0)
        subordinating conjunction (0) conjunction (0) preposition (0)

Per filtrare l'output è possibile utilizzare, ad esempio, tail -n8solo per ottenere i voti o grep 'Flesch\|SMOG'semplicemente stampare l'indice di Flesch e la classificazione SMOG:

$ style style_test | grep 'Flesch\|SMOG'
        Flesch Index: 51.7/100
        SMOG-Grading: 11.2

Ulteriori letture

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.