J'ai suivi un cours de probabilité à l'université il y a quelques années, mais je passe par quelques algorithmes d'apprentissage automatique maintenant et une partie des mathématiques est tout simplement déroutante.
Plus précisément, en ce moment, j'apprends l'algorithme EM (maximisation des attentes) et il semble qu'il y ait un grand décalage entre ce qui est requis et ce que j'ai.
Je ne demande pas un livre ou un site Web, mais comment apprendre suffisamment de ces sujets pour avoir une compréhension approfondie des algorithmes qui les utilisent? Faut-il parcourir un livre et faire des centaines d'exercices? Ou est-ce exagéré dans ce sens?
edit: Si ce n'est pas le bon endroit pour cette question, votez pour migrer :)
Réponses:
Beaucoup de livres et les introductions en ligne à l'apprentissage automatique fournissent une petite introduction à leur probabilité nécessaire dans leur contenu, donc je commencerais par un ou quelques livres de ce genre. Du haut de ma tête, je peux penser à la reconnaissance des modèles statistiques (peut-être parce que j'y ai appris la SE) et aux éléments de l'apprentissage statistique .
Mon vrai conseil serait les didacticiels d'exploration de données statistiques d'Andrew Moore. C'est le site qui a comblé le fossé que j'avais avant de commencer mon doctorat (issu d'une formation d'ingénieur). Je sais que vous avez dit que vous ne posiez pas de question sur un site Web, mais jetez un coup d'œil à la probabilité pour les mineurs de données là-bas et aux autres diapositives de probabilité avant de vous décider. Et jetez un œil aux modèles de mélange gaussiens pour EM.
Je ne pense pas. Les calculs de probabilité dans l'apprentissage automatique ont tendance à se regrouper autour de quelques chemins bien connus. Avoir une bonne compréhension de la distribution gaussienne unidimensionnelle et multidimensionnelle et étudier quelques explications de l'EM devrait vous mener assez loin. Et l'algèbre linéaire. Vous aurez besoin de beaucoup d'algèbre linéaire.
la source
L'intelligence artificielle a gagné en importance au cours de la dernière décennie, beaucoup dépendant du développement et de l'intégration de l'IA dans notre vie quotidienne. Les progrès que l'IA a déjà réalisés sont stupéfiants avec les voitures autonomes, le diagnostic médical et même les paris humains sur des jeux de stratégie comme Go et Chess.
L'avenir de l'IA est extrêmement prometteur et il n'est pas loin d'avoir nos propres compagnons robotiques. Cela a poussé de nombreux développeurs à commencer à écrire des codes et à commencer à développer des programmes AI et ML. Cependant, apprendre à écrire des algorithmes pour l'IA et le ML n'est pas facile et nécessite une vaste programmation et des connaissances mathématiques.
Les mathématiques jouent un rôle important car elles jettent les bases de la programmation de ces deux volets.
Il existe de nombreuses raisons pour lesquelles les mathématiques sont importantes pour l'apprentissage automatique. Certains d'entre eux sont ci-dessous:
Sélection du bon algorithme qui inclut des considérations sur la précision, le temps de formation, la complexité du modèle, le nombre de paramètres et le nombre de fonctionnalités. Choix des réglages des paramètres et des stratégies de validation. Identifier le sous-ajustement et le sur-ajustement en comprenant le compromis Bias-Variance. Estimation du bon intervalle de confiance et de l'incertitude.
Quel type de mathématiques est requis pour l'apprentissage automatique?
Les mathématiques sont absolument nécessaires pour l'étude de l'apprentissage automatique ou de l'intelligence artificielle. Toute compréhension plus approfondie des concepts et algorithmes en ML nécessite des connaissances de base en mathématiques.
Trois théories mathématiques principales: l'algèbre linéaire, le calcul multivarié et la théorie des probabilités.
Algèbre linéaire -
La notation d'algèbre linéaire est utilisée dans l'apprentissage automatique pour décrire les paramètres et la structure de différents algorithmes d'apprentissage automatique. Cela rend l'algèbre linéaire une nécessité pour comprendre comment les réseaux de neurones sont constitués et comment ils fonctionnent.
Il couvre des sujets tels que:
Scalaires, vecteurs, matrices, tenseurs Normes matricielles Matrices et vecteurs spéciaux Valeurs propres et vecteurs propres Calcul multivarié -
Ceci est utilisé pour compléter la partie d'apprentissage de l'apprentissage automatique. C'est ce qui est utilisé pour apprendre des exemples, mettre à jour les paramètres des différents modèles et améliorer les performances.
Il couvre des sujets tels que:
Dérivées Intégrales Gradients Opérateurs différentiels Optimisation convexe Théorie des probabilités -
Les théories sont utilisées pour faire des hypothèses sur les données sous-jacentes lorsque nous concevons ces algorithmes d'apprentissage en profondeur ou d'IA. Il est important pour nous de comprendre les distributions de probabilité clés,
Il couvre des sujets tels que:
Éléments de probabilité Variables aléatoires Distributions Variance et attente Variables aléatoires spéciales Comment apprendre rapidement les mathématiques pour l'apprentissage automatique?
La façon autonome d'apprendre les mathématiques pour la science des données est d'apprendre en «faisant de la merde». Même ainsi, vous voudrez apprendre ou revoir la théorie sous-jacente dès le départ. Vous n'avez pas besoin de lire un manuel entier, mais vous voudrez d'abord apprendre les concepts clés.
En tant que conditions préalables douces, je suppose la confortabilité de base avec le calcul d'algèbre / matrice linéaire (afin de ne pas rester bloqué sur la notation) et la probabilité d'introduction.
Si vous souhaitez apprendre les mathématiques pour l'apprentissage automatique en profondeur, il existe n nombre de cours disponibles en ligne, tels que,
Algèbre linéaire de Khan Academy, probabilités et statistiques, calcul multivariable et optimisation.
Fondation mathématique pour l'apprentissage automatique et l'IA sur eduonix
Apprenez les mathématiques de l'apprentissage automatique sur udemy
Coding the Matrix: Linear Algebra through Computer Science Applications par Philip Klein, Brown University.
Livre de Larry Wasserman - Toutes les statistiques: un cours concis d'inférence statistique.
N'oubliez pas que vous apprenez le mieux en faisant, et malheureusement, ces cours ne contiennent pas suffisamment de devoirs et de devoirs
Ce que je recommande, c'est Mathematical Foundation For Machine Learning and AI - Ce cours n'est pas un programme complet de mathématiques; il n'est pas conçu pour remplacer l'enseignement des mathématiques à l'école ou au collège. Au lieu de cela, il se concentre sur les concepts mathématiques clés que vous rencontrerez dans les études d'apprentissage automatique.
Ce que vous apprendrez:
Et beaucoup plus……
À la fin de ce cours, vous aurez non seulement les connaissances nécessaires pour créer vos propres algorithmes, mais également la confiance nécessaire pour commencer à utiliser vos algorithmes dans vos prochains projets.
Le cours comprend également des projets et des quiz pour vous aider à consolider vos connaissances des concepts mathématiques.
Il est conçu pour combler les lacunes des étudiants qui ont raté ces concepts clés dans le cadre de leur éducation formelle, ou qui ont besoin de se rafraîchir la mémoire après une longue pause dans leurs études en mathématiques.
Je pense que ce cours est beaucoup mieux que d'investir 2 à 3 mois en parcourant le matériel au début, puis en oubliant la moitié de ce que vous avez appris au moment où vous le rencontrez.
Essayez de comprendre les concepts de base présentés et n'oubliez pas de vous amuser!
la source