Fichier texte du dictionnaire [fermé]

222

J'écris un programme qui a besoin de BEAUCOUP de mots de la langue anglaise. J'essaie de trouver un fichier de dictionnaire contenant beaucoup de mots. Quelqu'un connaît-il une bonne source? J'ai essayé de nombreuses sources mais elles ne semblent pas l'avoir.

SuperString
la source
3
@DWright Je ne l'ai pas supprimé, je l'ai fermé car il n'est pas au sujet des attentes actuelles de Stack Overflow. Il demande explicitement des recommandations, des liens qui ne sont pas sur le sujet.
Taryn
Il est vrai que j'avais oublié que la mise en attente passe à Fermé, pas supprimée.
DWright
Donc, @bluefeet, désolé pour mon commentaire de "protestation" qui a été mal informé, votre action est correcte et ne déduit pas de valeur.
DWright
15
Pourquoi s'excuser? Il est clair que cela a de la valeur pour la communauté SO. Les «attentes actuelles» de SO manquent clairement la cible.
Andrew

Réponses:

224

Qu'en est-il /usr/share/dict/wordsde tout système Unix? De combien de mots parlons-nous? Comme OED-Unabridged?

Robert
la source
20
Merci ! 200000+ mots, très appréciés! cat /usr/share/dict/words > words.txttoutes les choses !
jokoon
7
Si ce fichier vous manque, vous pouvez l'installer sur Debian / Ubuntu en tapantsudo apt-get install wbritish
airstrike
17
Est-ce que quelqu'un connaît par hasard un endroit où cela peut être téléchargé pour les systèmes non Unix?
Tom
2
@ Tom Yeah, www.FreeBSD.org (installez FreeBSD quelque part et boum, vous l'avez). Sinon, je pense que cette liste est similaire: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Greg Schmit
2
Au cas où vous ne le sauriez pas: cela fonctionnera aussi sur macOS :)
lewis
44

Pour un fichier .txt de dictionnaire anglais, vous pouvez utiliser un dictionnaire personnalisé .

Vous pouvez également générer une liste aspell ou liste de mots avec ses propres paramètres.

Vous pouvez également consulter http://wordlist.sourceforge.net/

Uniquement les mots anglais: http://www.math.sjsu.edu/~foster/dictionary.txt

Sujith PS
la source
Bien que ce lien puisse répondre à la question, il est préférable d'inclure les parties essentielles de la réponse ici et de fournir le lien de référence. Les réponses de lien uniquement peuvent devenir invalides si la page liée change.
DeanOC
21
@DeanOC: Je pense qu'il est assez clair que les "parties essentielles" d'un dictionnaire seraient le dictionnaire entier. Ce n'est pas pratique à coller ici. Son utilisation est également assez simple: pour en extraire des mots. Ce n'est donc pas, en fait, un lien uniquement. C'est une réponse de recommandation légitime sur une question qui devrait être (et est maintenant) fermée.
Nathan Tuggy
@NathanTuggy Cette réponse est apparue dans la file d'attente LQP, et je pense qu'elle correspond à la définition d'une réponse de lien uniquement. En tant qu'utilisateur <3K rep, mon vote pour supprimer ne fait rien d'autre que d'aider à le porter à l'attention de quelqu'un qui le peut.
DeanOC
1
@DeanOC: Je sais qu'il est apparu dans LQP. J'ai frappé Looks OK, pour les raisons données: fondamentalement, ce "lien uniquement" est beaucoup plus subtil que "a un lien mais pas de code ou de citation? BURN WITH FIRE". Notez que suffisamment de choix de suppression recommandée par les utilisateurs, même 2k , supprimeront les messages. (J'ai personnellement été responsable de faire basculer un certain nombre de messages hors du bord.)
Nathan Tuggy
@NathanTuggy Vous êtes naturellement libre de voter comme bon vous semble. J'ai voté pour la suppression car je ne vois aucune valeur dans cette réponse si le lien devient périmé.
DeanOC
35

http://www.math.sjsu.edu/~foster/dictionary.txt

350 000 mots

Très tard, mais pourrait être utile pour d'autres.

Rajendra Uppal
la source
24
En regardant les premiers, beaucoup ne sont pas des mots anglais normaux.
tripleee
8
cela ne servait à rien car il manquait beaucoup de mots simples comme péché, dans, ...
FernandoZ
7
Oui, et a des mots comme "wwwwwww". Pas un mot.
Jared Forsyth
1
Attention, ce lien plante mon Firefox car il essaie de charger tout le fichier ahahahaha
Andrew
@Andrew ne plante pas dans Chrome 50.
Bogdan M.
11

Il y a aussi WordNet . Son format de fichiers de données est bien documenté.
Je l'ai utilisé pour créer une bibliothèque de dictionnaires intégrable pour les développeurs iOS ( www.lexicontext.com ) et également dans l'une de mes applications.

Ou Je
la source
2
Cagnotte. Dans le cas où quelqu'un cherche des mots mappés à leurs parties du discours, téléchargez simplement le package WordNet principal.
Andrew
10

@ Futurs chercheurs: vous pouvez utiliser aspell pour effectuer les vérifications du dictionnaire, il a des liaisons en rubis et python. Cela rendrait votre travail beaucoup plus simple.

Khaja Minhajuddin
la source