J'essaie de mettre en place un programme de mathématiques autogéré pour préparer l'apprentissage du data mining et du machine learning. Cela est motivé par le démarrage du cours d'apprentissage automatique d'Andrew Ng sur Coursera et le sentiment qu'avant de continuer, je devais améliorer mes compétences en mathématiques. J'ai obtenu mon diplôme universitaire il y a quelque temps, donc mon algèbre et mes statistiques (en particulier des cours de science politique / psychologie) sont rouillées.
Les réponses dans le fil de discussion Une solide formation en mathématiques est-elle une condition requise pour le ML? proposer uniquement des livres ou des cours directement liés à l'apprentissage automatique; J'ai déjà étudié certaines de ces classes et livres et je ne sais pas exactement quel sujet de mathématiques étudier (par exemple: quel domaine [s] d'adresse mathématique dérivant d'une équation pour "minimiser une fonction de coût"?). L'autre fil conducteur suggéré ( Compétences et cours nécessaires pour être un analyste de données ) ne mentionne que les grandes catégories de compétences nécessaires à l'analyse des données. Le fil Introduction aux statistiques pour les mathématiciens ne s'applique pas parce que je n'ai pas déjà un diplôme en mathématiques; un mathématicien de fil similaire veut les connaissances équivalentes à un degré de statistiques de qualité a une liste incroyable de livres de statistiques, mais encore une fois, je cherche à commencer les mathématiques à partir d'un souvenir rouillé de l'algèbre et à partir de là.
Donc, pour ceux qui travaillent dans l'apprentissage automatique et l'exploration de données, quels domaines de mathématiques trouvez-vous essentiels pour faire votre travail? Quelles matières mathématiques suggéreriez-vous pour préparer l'exploration de données et l'apprentissage automatique, et dans quel ordre? Voici la liste et l'ordre que j'ai jusqu'à présent:
- Algèbre
- Pré-calcul
- Calcul
- Algèbre linéaire
- Probabilité
- Statistiques (de nombreux sous-champs différents ici, mais je ne sais pas comment les décomposer)
En ce qui concerne l'exploration de données et l'apprentissage automatique, grâce à mon travail actuel, j'ai accès à des enregistrements sur l'activité du site Web / de l'application, les transactions des clients / abonnements et les données immobilières (statiques et chronologiques). J'espère appliquer l'exploration de données et l'apprentissage automatique à ces ensembles de données.
Merci!
MODIFIER:
Pour la postérité, je voulais partager une auto-évaluation mathématique utile pour le cours d' introduction à l'apprentissage automatique de Geoffrey Gordon / Alex Smola à la CMU.
la source
Réponses:
Les suggestions faites par @gung méritent certainement d'être suivies. Après avoir suivi le cours, je pense que votre liste est un bon début. Certains commentaires:
la source
Il y a quelques excellentes discussions sur ce forum-- y compris CELLE que j'ai trouvé particulièrement utile pour moi en termes de développement d' un schéma conceptuel des compétences importantes pour le travail scientifique des données.
Comme mentionné ci-dessus, de nombreux cours en ligne sont disponibles. Par exemple, Coursera a maintenant une spécialisation en science des données avec un certain nombre de cours qui couvriraient probablement certains des outils dont vous auriez besoin pour votre travail.
la source
Si vous cherchez à vous concentrer sur l'apprentissage automatique / l'exploration de données, je recommanderais fortement l'optimisation / l'algèbre linéaire / les statistiques et la probabilité. Voici une liste de livres pour la probabilité. J'espère que ça t'as aidé.
la source
En ce qui concerne le brossage des compétences mathématiques très très basiques, j'utilise ces livres:
Éléments de mathématiques pour l'économie et les finances. Mavron, Vassilis C., Phillips, Timothy N Ce livre couvre les compétences essentielles en mathématiques (addition soustraction), la différenciation partielle, l'intégration, la matrice et les déterminants, et un petit chapitre sur l'optimisation, ainsi que l'équation différentielle. Il est destiné à l'économie et à la finance, mais c'est un petit livre, la séquence de chapitres convient à mes besoins et facile à lire pour moi.
Analyse statistique: Microsoft Excel 2010. Conrad Carlberg Couvre l'analyse statistique de base, la régression multiple et l'analyse de covariance, et utilise Excel.
Découvrir les statistiques à l'aide de R. Andy Field, Jeremy Miles, Zoë Field. Je ne l'ai pas encore lu. Il utilise R.
Algèbre linéaire élémentaire. Ron Larson, David C. Falvo.
Méthodes matricielles: Algèbre linéaire appliquée Par Richard Bronson, Gabriel B. Costa. couvre l'algèbre linéaire élémentaire et le calcul matriciel
Ce sont les livres de mathématiques de base que j'utilise pour se rapporter à l'exploration de données / apprentissage automatique
J'espère que cela t'aides
la source
Il y a pas mal de ressources pertinentes répertoriées (et classées) ici , à ce qu'on appelle les "Open Source Data Science Masters".
Spécifiquement pour les mathématiques, ils énumèrent:
Recommandations assez génériques, bien qu'elles énumèrent certains manuels qui pourraient vous être utiles.
la source
la source
Algèbre linéaire, statistiques, calcul. Je pense que vous pouvez les apprendre en tandem w / ML - ou même après les bases. Les cours / livres de démarrage font un excellent travail avec les chapitres d'introduction aux mathématiques, et vous apprenez l'essentiel des mathématiques tout en apprenant le ML. J'ai fait un épisode de podcast sur les mathématiques dont vous avez besoin pour l'apprentissage automatique et les ressources pour les apprendre: Guide d'apprentissage automatique # 8
la source
Avant de commencer un cours d'apprentissage automatique, suivez le cours de mathématiques suivant. N'essayez pas non plus de creuser en une seule fois. Apprenez les concepts de base, puis perfectionnez vos compétences en mathématiques et répétez: -
Les sujets mathématiques sont les suivants: -
la source