Où puis-je télécharger la base de données de dictionnaires anglais au format texte? [fermé]

127

J'ai besoin de lire le fichier texte pour un mot et de renvoyer sa signification. Tout autre format de fichier fonctionnera également.

Abhi
la source
J'ai écrit un clawler Web pour tous les dictionnaires en ligne célèbres (Oxford, Longman, Cambridge, Webster et Collins) que vous pouvez utiliser pour créer votre ensemble de données. github.com/kiasar/Dictionary_crawler
Peyman

Réponses:

62

Le projet Gutenberg héberge le dictionnaire anglais Unabridged de Webster ainsi que de nombreuses autres œuvres littéraires du domaine public. En fait, il semble qu'ils aient plusieurs versions du dictionnaire hébergées avec des droits d'auteur de différentes années. Celui que j'ai lié a un copyright de 2009. Vous voudrez peut-être fouiller sur le site et étudier les différentes versions du dictionnaire Webster.

Asaph
la source
1
'09 transcription nettoyée de la version 1913, apparemment l'OCR n'était pas complètement propre. Il existe un total de 15 versions sur le site.
DragonLord
57

user1247808 a un bon lien avec: wget -c

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Si cela ne vous suffit pas:

http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (URL mise à jour de la suggestion de Michael Kropat)

Bien que ce nom de fichier change, vous voudrez trouver le dernier ... qui se révèle être juste un gros (très gros) fichier texte.

http://dumps.wikimedia.org/enwiktionary/

Orwellophile
la source
merci .. pour ce lien
AndyBoy
Vous pouvez toujours télécharger le dernier wiktionary sur dumps.wikimedia.org/enwiktionary/latest/...
Michael Kropat
androidtech / wordnet20 est au format SQL et non au format txt.
DragonLord
1
Remarque: la syntaxe du wordnet20 a un TYPE = * obsolète dans le fichier .sql. Exécutez sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sqlpour remplacer la syntaxe obsolète avant de l'exécuter sur une version 5.0+ de MySQL
Serguei Fedorov
pas de simple fichier txt contenant tous les mots anglais?
Nadav B
27

Je ne sais pas si c'est trop tard, mais j'ai pensé que cela aiderait quelqu'un d'autre.

Je voulais vraiment la même chose ... je l'ai finalement trouvée.

Ce n'est peut-être pas parfait, mais pour moi, c'est suffisant (pour ma petite application de dictionnaire).

http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip

Ce n'est pas un fichier de vidage, mais un fichier de script MYSQL .sql

Les mots sont dans la table WN_SYNSET et le glossaire / signification dans la table WN_GLOSS

user1247808
la source
4
Sous quelle licence s'agit-il?
Cole Johnson
2
Je ne suis pas sûr non plus, mais sur androidtech.com/html/downloads.php il y aHere are some files related to natural language and chatterbot projects that we are making available to the public
Betlista
7
Utilisateurs MySQL: les instructions create table utilisent l'option TYPE désormais supprimée. Exécutez ceci sur le fichier sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sqlpour le faire fonctionner dans la dernière version de MySQL
anthonygore
15

Vérifiez si ces ressources gratuites correspondent à vos besoins -

mvark
la source
8
FOLDOC (Dictionnaire gratuit en ligne de l'informatique) semble être un dictionnaire de termes / noms informatiques uniquement. Cela pourrait être utile pour certains, mais ce n'est pas un dictionnaire général dans
lequel
2
Le lien de la page ObjectGraph est également mort. Les versions officielles téléchargeables se trouvent ici .
Lèse majesté
@ Lèsemajesté votre lien est également mort maintenant
yukashima huksay