Questions marquées «nltk»

29
Pourquoi xgboost est-il tellement plus rapide que sklearn GradientBoostingClassifier?

J'essaie de former un modèle d'augmentation de gradient sur plus de 50k exemples avec 100 fonctionnalités numériques. XGBClassifiergère 500 arbres en 43 secondes sur ma machine, alors qu'il GradientBoostingClassifierne gère que 10 arbres (!) en 1 minute et 2 secondes :( Je n'ai pas pris la peine...

15
Similitude entre deux mots

Je recherche une bibliothèque Python qui m'aide à identifier la similitude entre deux mots ou phrases. Je ferai une conversion audio en texte qui se traduira par un dictionnaire anglais ou des mots non-dictionnaire (cela pourrait être un nom de personne ou d'entreprise) Après cela, je dois le...

8
Chunking complexe avec NLTK

J'essaie de comprendre comment utiliser le chunker en cascade de NLTK conformément au chapitre 7 du livre NLTK . Malheureusement, je rencontre quelques problèmes lors de l'exécution de mesures de segmentation non triviales. Commençons par cette phrase: "adventure movies between 2000 and 2015...