Je suis un novice qui va commencer à lire sur l'exploration de données. J'ai une connaissance de base de l'IA et des statistiques. Étant donné que beaucoup disent que l'apprentissage automatique joue également un rôle important dans l'exploration de données, est-il nécessaire de lire sur l'apprentissage automatique avant de pouvoir continuer avec l'exploration de données?
14
Réponses:
Étant moi-même un peu dans cette position, je vais essayer de donner un aperçu.
Tout d'abord, téléchargez les éléments de l'apprentissage statistique . Il suppose le calcul et l'algèbre linéaire, et bien qu'il soit très technique, il est également extrêmement bien écrit.
Deuxièmement (ou premièrement) regardez les tutoriels d'Andrew Ng sur l'apprentissage automatique.
Troisièmement, obtenez des données et commencez à essayer d'analyser les données. Vous devrez vous diviser en ensembles de formation et de test, puis créer des modèles sur l'ensemble de formation et les tester par rapport à l'ensemble de test. J'ai trouvé le package caret pour R très utile pour tout cela. Après cela sa pratique, pratiquez la pratique (comme presque tout le reste).
la source
Introduction à l'exploration de données par Tan, Steinbech, Kumar est le meilleur livre d'introduction
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
enregistrez EoSL pour quand vous voulez creuser plus profondément. C'est plus une référence.
la source
L'exploration de données peut être descriptive ou prédictive.
D'une part, si vous êtes intéressé par l'exploration de données descriptives, alors l'apprentissage automatique n'aidera pas.
la source
J'ajoute seulement une autre très bonne source de tutoriels sur l'exploration de données / l'apprentissage automatique par Tom Mitchell .
Il l'explique très clairement et vous pouvez également télécharger ses présentations sur son site Web (en y regardant ses conférences).
la source