Salut, j'écris un jeu où le joueur doit connecter un groupe de lettres pour former des mots. Quelque chose comme le rat de bibliothèque, mais ce sera très différent, j'espère.
Le point de la question est que j'ai besoin de construire un dictionnaire de mots.
J'ai créé un programme Java simple qui explore le Web et extrait des mots, mais beaucoup de déchets sont mélangés avec les bons mots et il est impossible de les nettoyer. Je parle de 100 000 mots.
Y a-t-il un dictionnaire disponible qui peut être utilisé librement ou quelqu'un a une idée de comment en créer un?
Merci!
Le site suivant tente d'accumuler des liens vers différents projets de dictionnaire ouvert. Si je comprends bien ce qu'ils font, ils proposent des packages de dictionnaires que vous pourriez potentiellement télécharger et lire avec votre application. J'espère que cela vous mènera dans une direction utile.
Ouvrir des bases de données de dictionnaire
la source
Le projet Moby est le plus grand que je connaisse. C'est aussi la source du package "mots" de Fedora par exemple, du moins en anglais.
la source
Celui-ci semble assez agréable, bien que je ne sache pas par rapport aux autres.
Semble également être dans un format facilement analysable et lisible.
la source
J'ai effectué quelque chose récemment où j'ai déchiré chaque mot hors de la guerre et de la paix alors qu'il ne contient pas chaque mot du dictionnaire, il a l'avantage supplémentaire de pouvoir compter l'utilisation des mots pour avoir une idée de la répartition de l'utilisation, vous trouverez également de l'argot mots et noms cependant, bien que ceux-ci puissent être filtrés assez simplement
la source