Comment commencer à lire sur l'exploration de données?

14

Je suis un novice qui va commencer à lire sur l'exploration de données. J'ai une connaissance de base de l'IA et des statistiques. Étant donné que beaucoup disent que l'apprentissage automatique joue également un rôle important dans l'exploration de données, est-il nécessaire de lire sur l'apprentissage automatique avant de pouvoir continuer avec l'exploration de données?

Fourmis
la source
1
Exploration de données: concepts et techniques Par Jiawei Han est un bon début
aaronjg

Réponses:

12

Étant moi-même un peu dans cette position, je vais essayer de donner un aperçu.

Tout d'abord, téléchargez les éléments de l'apprentissage statistique . Il suppose le calcul et l'algèbre linéaire, et bien qu'il soit très technique, il est également extrêmement bien écrit.

Deuxièmement (ou premièrement) regardez les tutoriels d'Andrew Ng sur l'apprentissage automatique.

Troisièmement, obtenez des données et commencez à essayer d'analyser les données. Vous devrez vous diviser en ensembles de formation et de test, puis créer des modèles sur l'ensemble de formation et les tester par rapport à l'ensemble de test. J'ai trouvé le package caret pour R très utile pour tout cela. Après cela sa pratique, pratiquez la pratique (comme presque tout le reste).

richiemorrisroe
la source
1
vous effrayerez le pauvre homme pour toujours!
Neil McGuigan
Le cours d'Andew Ng sera «offert gratuitement et en ligne» aux étudiants du monde entier au cours de l'automne 2011 selon ml-class.org
Andre Holzner
4

L'exploration de données peut être descriptive ou prédictive.

D'une part, si vous êtes intéressé par l'exploration de données descriptives, alors l'apprentissage automatique n'aidera pas.

kn

  • kn
  • knn
Wok
la source
3
k/n . Personnellement, j'aime l'approche de Radford Neale, dans son cours sur les méthodes statistiques pour l'apprentissage automatique et l'exploration de données : de nombreux problèmes d'apprentissage automatique ont un grand nombre de variables, les applications d'exploration de données impliquent souvent un très grand nombre de cas.
chl
3

J'ajoute seulement une autre très bonne source de tutoriels sur l'exploration de données / l'apprentissage automatique par Tom Mitchell .

Il l'explique très clairement et vous pouvez également télécharger ses présentations sur son site Web (en y regardant ses conférences).

Miroslav Sabo
la source