Questions marquées «nltk»

Le Natural Language Toolkit est une bibliothèque Python pour la linguistique informatique.

137
n-grammes en python, quatre, cinq, six grammes?

Je cherche un moyen de diviser un texte en n-grammes. Normalement, je ferais quelque chose comme: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Je suis conscient que nltk ne propose que des bigrammes...

134
Comment vérifier si un mot est un mot anglais avec Python?

Je veux vérifier dans un programme Python si un mot est dans le dictionnaire anglais. Je pense que l'interface nltk wordnet pourrait être la solution, mais je n'ai aucune idée de comment l'utiliser pour une tâche aussi simple. def is_english_word(word): pass # how to I implement is_english_word?...