Outil pour mesurer la lisibilité du texte anglais

13

Existe-t-il un programme en ligne de commande qui prend un fichier contenant du texte anglais, analyse le texte et génère ses scores de lisibilité?

Par exemple, si l'on alimente le programme en texte, le programme devrait afficher le niveau de qualité Flesch-Kincaid, le classement SMOG de McLaughlin, etc.

Je crois qu'un tel programme existe dans les dépôts officiels, mais je ne me souviens pas de son nom. Il y a aussi la possibilité que je me trompe.

Flux
la source

Réponses:

11

Le diction Installer la dictionpackage contient un outil appelé style:

Style analyse les caractéristiques de surface du style d'écriture d'un document. Il imprime différents degrés de lisibilité, la longueur des mots, des phrases et des paragraphes. Il peut également localiser des phrases présentant certaines caractéristiques.

Par exemple, si j'évalue votre corps de question (enregistré dans un fichier flux_question) pour imprimer les phrases avec un index de lisibilité (ARI) sur 10:

$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
        Kincaid: 10.2
        ARI: 10.8
        Coleman-Liau: 12.5
        Flesch Index: 51.1/100
        Fog Index: 12.0
        Lix: 48.6 = school year 9
        SMOG-Grading: 11.2
sentence info:
        333 characters
        65 words, average length 5.12 characters = 1.65 syllables
        4 sentences, average length 16.2 words
        25% (1) short sentences (at most 11 words)
        0% (0) long sentences (at least 26 words)
        1 paragraphs, average length 4.0 sentences
        25% (1) questions
        25% (1) passive sentences
        longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
        verb types:
        to be (1) auxiliary (2) 
        types as % of total:
        conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
        nominalizations 0% (0)
sentence beginnings:
        pronoun (1) interrogative pronoun (0) article (0)
        subordinating conjunction (0) conjunction (0) preposition (0)

Pour filtrer la sortie, vous pouvez par exemple utiliser tail -n8pour obtenir uniquement les notes ou grep 'Flesch\|SMOG'simplement imprimer l'index Flesch et la notation SMOG:

$ style style_test | grep 'Flesch\|SMOG'
        Flesch Index: 51.7/100
        SMOG-Grading: 11.2

Lectures complémentaires

dessert
la source