Mon code:
import nltk.data
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
Message d'erreur:
[ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py
Traceback (most recent call last):
File "mapper_local_v1.0.py", line 16, in <module>
tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 774, in load
opened_resource = _open(resource_url)
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 888, in _open
return find(path_, path + ['']).open()
File "/usr/lib/python2.6/site-packages/nltk/data.py", line 618, in find
raise LookupError(resource_not_found)
LookupError:
Resource u'tokenizers/punkt/english.pickle' not found. Please
use the NLTK Downloader to obtain the resource:
>>>nltk.download()
Searched in:
- '/home/ec2-user/nltk_data'
- '/usr/share/nltk_data'
- '/usr/local/share/nltk_data'
- '/usr/lib/nltk_data'
- '/usr/local/lib/nltk_data'
- u''
J'essaye d'exécuter ce programme sur une machine Unix:
Selon le message d'erreur, je me suis connecté au shell python depuis ma machine unix puis j'ai utilisé les commandes ci-dessous:
import nltk
nltk.download()
puis j'ai téléchargé toutes les choses disponibles en utilisant les options d-down loader et l-list mais le problème persiste.
J'ai fait de mon mieux pour trouver la solution sur Internet, mais j'ai obtenu la même solution que celle que j'ai mentionnée dans les étapes ci-dessus.
Réponses:
Pour compléter la réponse d' alvas , vous ne pouvez télécharger que le
punkt
corpus:Le téléchargement
all
me semble excessif. Sauf si c'est ce que tu veux.la source
Si vous souhaitez télécharger uniquement le
punkt
modèle:Si vous ne savez pas quelles données / modèle que vous avez besoin, vous pouvez installer les populaires jeux de données, des modèles et des tagueurs de NLTK:
Avec la commande ci-dessus, il n'est pas nécessaire d'utiliser l'interface graphique pour télécharger les ensembles de données.
la source
J'ai la solution:
une fois que le NLTK Downloader démarre
d) Télécharger l) Liste u) Mettre à jour c) Config h) Aide q) Quitter
Téléchargeur> d
Télécharger quel package (l = liste; x = annuler)? Identifiant> punkt
la source
Depuis le shell, vous pouvez exécuter:
Si vous souhaitez installer les corpus / modèles NLTK populaires:
Si vous souhaitez installer tous les corpus / modèles NLTK:
Pour répertorier les ressources que vous avez téléchargées:
la source
Ouvrez l'invite Python et exécutez les instructions ci-dessus.
La fonction sent_tokenize utilise une instance de PunktSentenceTokenizer du module nltk.tokenize.punkt . Cette instance a déjà été formée et fonctionne bien pour de nombreuses langues européennes. Ainsi, il sait quelle ponctuation et quels caractères marquent la fin d'une phrase et le début d'une nouvelle phrase.
la source
La même chose m'est arrivée récemment, il vous suffit de télécharger le package "punkt" et cela devrait fonctionner.
Lorsque vous exécutez "list" (l) après avoir "téléchargé toutes les choses disponibles", tout est-il marqué comme la ligne suivante?:
Si vous voyez cette ligne avec l'étoile, cela signifie que vous l'avez, et nltk devrait pouvoir la charger.
la source
Accédez à la console python en tapant
dans votre terminal. Ensuite, tapez les 2 commandes suivantes dans votre shell python pour installer les packages respectifs:
Cela a résolu le problème pour moi.
la source
Mon problème était que j'ai appelé en
nltk.download('all')
tant qu'utilisateur root, mais le processus qui a finalement utilisé nltk était un autre utilisateur qui n'avait pas accès à / root / nltk_data où le contenu a été téléchargé.J'ai donc simplement copié récursivement tout de l'emplacement de téléchargement vers l'un des chemins où NLTK cherchait à le trouver comme ceci:
la source
Exécutez le code suivant:
Après cela, le téléchargeur NLTK apparaîtra.
la source
J'obtenais une erreur malgré l'importation de ce qui suit,
mais pour google colab, cela a résolu mon problème.
la source
Simple nltk.download () ne résoudra pas ce problème. J'ai essayé ce qui suit et cela a fonctionné pour moi:
dans le dossier nltk, créez un dossier tokenizers et copiez votre dossier punkt dans le dossier tokenizers.
Cela fonctionnera.! la structure du dossier doit être comme indiqué sur l'image
la source
Vous devez réorganiser vos dossiers Déplacez votre
tokenizers
dossier dans unnltk_data
dossier. Cela ne fonctionne pas si vous avez unnltk_data
dossier contenant uncorpora
dossier contenant untokenizers
dossierla source
Pour moi, rien de ce qui précède n'a fonctionné, alors j'ai juste téléchargé tous les fichiers à la main à partir du site Web http://www.nltk.org/nltk_data/ et je les ai également mis à la main dans un fichier "tokenizers" à l'intérieur de "nltk_data "dossier. Pas une jolie solution mais toujours une solution.
la source
Après avoir ajouté cette ligne de code, le problème sera résolu:
la source
J'ai fait face au même problème. Après avoir tout téléchargé, l'erreur «punkt» était toujours là. J'ai recherché le package sur ma machine Windows à C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers et je peux voir 'punkt.zip' présent. J'ai réalisé que d'une manière ou d'une autre, le zip n'a pas été extrait dans C: \ Users \ vaibhav \ AppData \ Roaming \ nltk_data \ tokenizers \ punk. Une fois que j'ai extrait le zip, cela fonctionnait comme de la musique.
la source
Assurez-vous simplement que vous utilisez
Jupyter
Notebook et que dans un notebook, procédez comme suit:Ensuite, une fenêtre contextuelle apparaîtra (montrant des informations https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml ) À partir de là, vous devez tout télécharger.
Puis réexécutez votre code.
la source
Pour moi, il a été résolu en utilisant "nltk:"
http://www.nltk.org/howto/data.html
Échec du chargement de english.pickle avec nltk.data.load
la source