J'ai installé python-nltk sur Ubuntu Server 12.04 en utilisant apt-get.
Mais lorsque j'essaie de télécharger un corpus, j'obtiens l'erreur suivante:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False
Suis-je en train de manquer une configuration ou un package supplémentaire?
wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install
. Mais un problème a été soulevé dans github.com/nltk/nltk/issues/747Réponses:
L'
DEFAULT_URL
utilisé dansdownloader.py
de la version emballée d'Ubuntu utilise toujours:Mais le serveur de données actuel est:
Vous pouvez bien sûr installer depuis la source ou ... modifier votre version déjà installée pour pointer vers le nouveau serveur comme ceci:
Vous pouvez ensuite installer le corpus "marron":
la source
Il est possible de corriger cela sans changer le code source. Créez un téléchargeur personnalisé en python:
puis vous ouvrez une boîte de dialogue GUI:
Vérifiez que vous disposez d'un accès en écriture au répertoire de téléchargement et téléchargez ce dont vous avez besoin.
la source
Celui-ci met à jour le nltk et
nltk.download()
fonctionne à nouveau.la source