Je commence à vouloir développer mes propres compétences et j'ai toujours été fasciné par l'apprentissage automatique. Cependant, il y a six ans, au lieu de poursuivre dans cette voie, j'ai décidé de passer à un autre niveau en informatique.
Je développe des logiciels et des applications depuis environ 8 à 10 ans maintenant, donc je maîtrise bien le processus, mais je n'arrive pas à pénétrer le côté mathématique de l'apprentissage machine / probabilités / statistiques.
Je commence à regarder le matériel d'apprentissage et à la première page, cela peut inclure quelque chose qui me trouble et met immédiatement en place une barrière dans mon apprentissage.
- Une solide formation en mathématiques est-elle une condition préalable à la maîtrise du blanchiment? Devrais-je essayer de remplir les blancs de mes calculs avant de continuer avec ML? Est-ce que l'auto-apprentissage peut vraiment fonctionner pour un développeur sans aucune connaissance en informatique?
Question connexe:
Réponses:
Stanford (Ng) et Caltech (Abu-Mostafa) ont mis en place des cours d'apprentissage automatique sur YouTube. Vous ne pouvez pas voir les devoirs, mais les conférences ne comptent pas sur ceux-ci. Je recommande d'essayer de regarder ces vidéos en premier, car elles vous aideront à découvrir les mathématiques que vous devez apprendre. Je crois qu'un cours très similaire avec des devoirs est enseigné par Andrew Ng sur Coursera, que Ng a aidé à créer.
Une exception: si je me souviens bien, au début des conférences à Stanford, Ng effectue des calculs impliquant des dérivés de traces de produits de matrices. Celles-ci sont plutôt isolées, alors ne vous inquiétez pas si vous ne suivez pas ces calculs. Je ne sais même pas quel cours les couvrirait.
Vous voulez vous familiariser avec les probabilités, l’algèbre linéaire, la programmation linéaire et le calcul multivariable. Cependant, vous avez besoin de beaucoup moins que ce qui est contenu dans de nombreuses classes universitaires complètes sur ces sujets.
la source
En fonction du type d'application, vous n'avez pas nécessairement besoin de beaucoup de maths en tant que praticien du ML.
En tant que programmeur autodidacte (environ 15 ans) et fréquemment décrocheur du collège sans connaissances approfondies en mathématiques (Calcul III) ou en statistique, j'ai commencé par l'apprentissage automatique / l'extraction de données avec quelques ressources:
Le livre "Maîtriser l'exploration de données: l'art et la science de la gestion de la relation client" de Berry et Linoff
Le livre "Data Mining Techniques" des mêmes auteurs
R, en particulier et les paquets party et nnet
Je travaille dans un marketing et des opérations de soutien à but non lucratif. Surtout au début, j'ai utilisé l’exploration de données principalement pour les appels par publipostage.
Plus tard, j'ai pris l'algèbre linéaire, Apprentissage automatique d'Andrew Ng, Introduction aux méthodes statistiques (STAT 301) à la CSU, etc.
Pour vous, je vous recommande de commencer par les deux cahiers, le cours d’Andrew Ng et, en fonction de votre application, des arbres de décision (le paquet du parti en R).
la source
Je pense que c’est une bonne question, d’actualité; Je ne suis pas sûr s'il y a une réponse cependant. Un article récent a suscité beaucoup de controverses (voir ici ) en suggérant qu'il était facile d'apprendre la science des données en ligne. Cependant, la plupart des études de cas mentionnées dans cet article ont ceci d’important qu’elles proviennent de milieux actuariels ou mathématiques.
Ceci est un point intéressant, car il indique que, bien que des cours en ligne tels que Coursera, Stanford et edX soient utiles pour enseigner les compétences informatiques spécifiques requises, il est probable que des connaissances en mathématiques soient essentielles pour comprendre ce que font les modèles que vous appliquez. . D'autre part, un argument tout aussi convaincant pourrait être avancé: ces gars-là avaient tous un esprit analytique, c'est à la fois la raison pour laquelle ils travaillent dans des disciplines quantitatives et la raison pour laquelle ils ont facilement appris la machine et ont remporté des concours.
Je pense fondamentalement qu'il y a un problème de niveaux d'analyse qui se pose ici. Bien que les compétences en mathématiques soient parfois utiles pour comprendre les racines probabilistes des algorithmes que vous appliquez, il est tout aussi bon de dire que de bonnes compétences en génie logiciel peuvent également apporter beaucoup en vous permettant d'effectuer une analyse de haut niveau et de constituer des parties d'algorithmes. pour atteindre votre objectif, même si vous ne comprenez pas tout à fait pourquoi ils le font . Généralement, la science des données (et l’apprentissage automatique par association) est un domaine passionnant précisément à cause de son étendue - vous pouvez être un gars de base de données et utiliser la force brutale pour résoudre des problèmes, ou un mathématicien qui utilise la simulation, ou un informaticien qui tire parti de technologies bien conçues. code pour mettre en place différents algorithmes et approches de manière optimale.
Toutes les approches qui ajoutent à la prédiction sont bonnes, je dirais donc que l'apprentissage de quelques mathématiques peut être une bonne idée pour vous donner les meilleures chances de succès sur le terrain. Si vous voulez de bons points de départ, MIT a un grand cours d'algèbre linéaire , avec quelques applications de calcul utiles, que j'ai trouvé facile à comprendre. Ils ont également d'autres cours sur les processus stochastiques et le calcul multivariable qui pourraient également vous intéresser pour renforcer vos connaissances.
la source
Une solide formation en mathématiques est-elle une condition préalable à la maîtrise du blanchiment? - une réponse et quelques spéculations sur le ML considérées comme des statistiques ;-)
Vers 1990, j’espérais que l’algèbre informatique serait utile, mais je pense que c’est assez limité. Mais cela aide certainement à accélérer l’apprentissage des mathématiques (moins de besoin de développer des aptitudes à la manipulation par la pratique ou d’essayer de se débrouiller en ne faisant que des exercices simples). J'ai trouvé l'algèbre linéaire de Fred Szabo avec Mathematica comme un excellent exemple (mais j'avais déjà suivi un cours d'algèbre linéaire de niveau avancé.)
Je travaille depuis 1988 (en utilisant des méthodes informatiques intensives pour "concrétiser" des théorèmes et des principes à partir de statistiques - précisément) pour que la réponse soit non ou du moins pas nécessaire (pour les statistiques). On pourra toujours comprendre plus rapidement et plus généralement avec des compétences et une compréhension supplémentaires en mathématiques. Je pense que je commence à me rapprocher, mais il faut une représentation manipulable des modèles générateurs de probabilité et des inférences valides et pertinentes . utile pour plus que des problèmes de jouets.
Devrais-je essayer de remplir les blancs de mes calculs avant de continuer avec ML?
C’est une entreprise difficile - dans les MHO, presque tout le monde qui comprend que les statistiques y parviennent en étant très à l’aise pour manipuler la norme et représentations mathématiques surtout non standards des modèles générateurs de probabilités et les caractérisations mathématiques de l’inférence (les x% les plus élevés de la statistique mathématique Phds). Donc, il ne suffit pas d’obtenir les bases, mais d’être à l’aise avec les mathématiques. (En passant, pour moi, la théorie de Fourier était essentielle.)
Pourquoi ces représentations sont-elles difficiles (même avec beaucoup de mathématiques)?
Gerd Gigerenzer a à peu près établi qu'il n'y avait pas de problème avec la maladie simple positive / négative étant donné que le test était positif / négatif et utilisait des fréquences naturelles ». Une référence de la question liée semble faire bon usage de celle http://www.autonlab.org/tutorials/prob18.pdf
Pourquoi est-ce difficile à généraliser?
Pour k tests (répétés et / ou différents) - 2 ^ k
Pour les tests qui prennent des valeurs v - v ^ k
Donc, pour binaire inconnu - 2 * v ^ k probabilités de chemin d’échantillonnage
Pour p multiples inconnues binaires 2 ^ p * v ^ k
Pour p multiples inconnues rationnelles Q ^ p * v ^ k
On passe rapidement aux maths avec des infinis dénombrables et innombrables pour y faire face, ce qui, même avec une expertise mathématique, conduit à de nombreux malentendus et paradoxes apparents (par exemple le paradoxe de Borel?)
En outre, il existe des incompréhensions dangereuses linéaires à non linéaires (par exemple, les dangers cachés de la spécification de Priors non informatifs, Winbugs et d'autres MCMC sans information de distribution préalable ), les interactions et les effets aléatoires, etc.
la source