Hein,
il existe de nombreux outils et bibliothèques avec les fonctionnalités disponibles.
Le choix dépend de si vous souhaitez utiliser une interface graphique pour votre travail ou si vous souhaitez l'intégrer dans un autre programme.
Outils d'exploration de données autonomes (il existe des outils comme WEKA avec interface Java):
- Mineur rapide
- Orange
- Hochet gui pour R
- KNIME
Basé sur le texte:
Libs:
- Scikit pour Python
- Mahout sur Hadoop
Si vous connaissez assez bien un langage de programmation, j'utiliserais une bibliothèque pour ce langage ou j'essaierais R. Sinon, vous pouvez essayer l'un des outils avec gui.
Un exemple d'arbre dans R:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
Comme suggéré, l'analyse avec R vous oblige à vous coder, mais vous trouverez un package pour la plupart des tâches de classification qui fonctionnera hors de la boîte. Un aperçu peut être trouvé ici Vue des tâches d'apprentissage automatique
Pour commencer avec RapidMinder, vous devriez jeter un œil à Youtube. Il existe des captures d'écran, même pour les arbres de décision.
Weka est une suite d'outils d'apprentissage automatique gratuite et open-source. Ils ont une interface graphique ainsi qu'une API pour appeler à partir de votre code Java si vous le souhaitez.
Ils ont de nombreux algorithmes de classification, dont plusieurs algorithmes d'arbre de décision. Ils sont disponibles dans l'interface utilisateur. Les voisins les plus proches sont un peu plus compliqués et il semble que vous devez utiliser l'API directement .
Je pense que Rapid Miner prend probablement en charge ce type de chose, mais je ne l'ai jamais utilisé à de telles fins auparavant.
Vous pourriez également envisager R , mais cela pourrait nécessiter de vous salir les mains un peu plus.
Notez que Netflix a fait une tonne de travail dans la classification des films. Il y a plusieurs années, ils ont offert un prix d'un million de dollars au groupe qui pourrait le plus améliorer leur classement. Vous pourriez être intéressé à lire comment différentes équipes ont abordé ce problème.
la source
Peut-être ... WEKA? http://www.cs.waikato.ac.nz/ml/weka/
la source