J'ai besoin d'une base de données de chaque mot valide en anglais. J'ai vérifié le /usr/share/dict/words
fichier, il contient moins de 100k mots. Wikipedia dit que l'anglais compte 475k mots. Où puis-je obtenir la liste complète (orthographe américaine)?
En outre, existe-t-il un site Web unique qui donne également des mots pour d'autres langues, y compris les langues asiatiques et européennes?
Edit: J'ai oublié d'ajouter, je n'ai pas besoin de noms, etc., juste des mots anglais valides.
/usr/share/dict/words
a 479829 mots, donc peut-être qu'il y a une variation ici (et pourrait convenir à d'autres).wc -l /usr/share/dict/words
sur Mac est de 235886 mots (juillet 2014 - OSX Mavericks 10.9.4)Réponses:
WordNet base de données peut être utile. Une fois, j'ai travaillé sur un module complémentaire pour Firefox qui traite des mots et toutes sortes d'associations simples à compliquées entre eux et des choses. On dirait que WordNet vous sera très utile.
Le voici au format MySQL . Et celui-ci (lien archivé sur le Web) utilise les données Wordnet v3.0, plutôt que les anciennes données Wordnet 2.0.
la source
Vous pouvez trouver ce dont vous avez besoin sur infochimps.org .
Ils ont une liste de 350 000 mots simples (c'est-à-dire non composés) disponibles en téléchargement gratuit.
Liste de mots - 350000+ mots anglais simples
En ce qui concerne les autres langues, vous voudrez peut-être fouiller sur Wiktionary. Voici un lien vers toutes les sauvegardes de la base de données - les informations ne sont pas organisées si probablement, mais si elles ont une langue, vous pouvez télécharger les données au format SQL.
la source
Je ne vois pas http://wordlist.sourceforge.net/ mentionné ici, mais c'est là que je commencerais si je cherchais quelque chose comme ça (et je l'étais, quand je suis tombé sur cette question).
Si vous ne trouvez pas ce que vous voulez là-bas et que vous voulez une liste de mots anglais, vous devriez probablement passer un peu plus de temps à décrire comment reconnaître ce que vous voulez.
la source
Il n’existe pas de liste «complète». Différentes personnes ont différentes façons de mesurer - par exemple, elles peuvent inclure de l'argot, des néologismes, des phrases à plusieurs mots, des termes offensants, des mots étrangers, des conjugaisons de verbes, etc. Certaines personnes ont même compté un million de mots ! Vous devrez donc décider de ce que vous voulez dans une liste de mots.
la source
Vous pouvez consulter le
*spell
dictionnaire en-GB utilisé par Mozilla, OpenOffice, de nombreux autres logiciels.la source
Vous n'avez pas dit pourquoi vous aviez besoin de cette liste. Si quelque chose utilisé comme liste noire pour les vérifications de mot de passe est suffisant, cracklib pourrait être bon pour vous. Il contient plus de 1,5 million de mots.
la source