Pouvez-vous recommander un package d'exploration de texte dans R qui peut être utilisé contre de gros volumes de données?
Deuxièmement, existe-t-il une interface graphique disponible pour l'un des packages d'exploration de texte dans R?
Troisièmement, existe-t-il un autre programme d'exploration de texte open source qui est facile et intuitif à utiliser?
12
Réponses:
Veuillez consulter la vue des tâches du CRAN sur le traitement du langage naturel qui comprend, entre autres, le package tm déjà mentionné par Josh.
la source
Voir le package tm et cette présentation de Stefan Theussl lors de la conférence R / Finance 2010 .
la source
Voici deux autres projets intégrés:
Les deux sont des logiciels open source.
la source
Bien sûr, RapidMiner avec l'extension d'exploration de texte.
Il existe de nombreuses vidéos qui montrent comment cela se fait.
la source
GATE est très complet. Il vous permet également de travailler avec différentes langues et dispose d'un éditeur d'ontologie.
la source
Andrew McCallum (UMass) a quelques projets logiciels liés à la PNL disponibles sur sa page Web . Ce sont tous en Java (je pense) avec du code source disponible.
la source
Outre la vue des tâches CRAN sur le traitement du langage naturel mentionnée par Dirk, il existe des packages quanteda et NLP .
la source