J'écris un programme qui a besoin de BEAUCOUP de mots de la langue anglaise. J'essaie de trouver un fichier de dictionnaire contenant beaucoup de mots. Quelqu'un connaît-il une bonne source? J'ai essayé de nombreuses sources mais elles ne semblent pas l'avoir.
dictionary
SuperString
la source
la source
Réponses:
Qu'en est-il
/usr/share/dict/words
de tout système Unix? De combien de mots parlons-nous? Comme OED-Unabridged?la source
cat /usr/share/dict/words > words.txt
toutes les choses !sudo apt-get install wbritish
Pour un fichier .txt de dictionnaire anglais, vous pouvez utiliser un dictionnaire personnalisé .
Vous pouvez également générer une liste aspell ou liste de mots avec ses propres paramètres.
Vous pouvez également consulter http://wordlist.sourceforge.net/
Uniquement les mots anglais: http://www.math.sjsu.edu/~foster/dictionary.txt
la source
Jetez également un œil à:
la source
95 (insane)
3 (seldom used)
Strip
donne environ 675K mots.http://www.math.sjsu.edu/~foster/dictionary.txt
350 000 mots
Très tard, mais pourrait être utile pour d'autres.
la source
Il y a aussi WordNet . Son format de fichiers de données est bien documenté.
Je l'ai utilisé pour créer une bibliothèque de dictionnaires intégrable pour les développeurs iOS ( www.lexicontext.com ) et également dans l'une de mes applications.
la source
@ Futurs chercheurs: vous pouvez utiliser aspell pour effectuer les vérifications du dictionnaire, il a des liaisons en rubis et python. Cela rendrait votre travail beaucoup plus simple.
la source