Je suis ingénieur en informatique sans expérience en statistique ou en mathématiques avancées.
J'étudie le livre Python Machine Learning de Raschka et Mirjalili, mais quand j'ai essayé de comprendre les mathématiques du Machine Learning, je n'ai pas pu comprendre le grand livre qu'un ami m'a proposé The Elements of Statistical Learning .
Connaissez-vous des statistiques et des livres de mathématiques plus faciles pour l'apprentissage automatique? Si vous ne le faites pas, comment dois-je déménager?
Réponses:
Bien que vous ayez besoin d'un livre, je recommande les cours suivants respectivement pour comprendre les statistiques utilisées pour l'apprentissage automatique et d'autres tâches en science des données. Ils sont libres.
Si je veux recommander un livre, je recommanderais le livre suivant qui est gratuit sous licence CC . Il a de beaux exemples et est tellement pratique; en outre, il contient de nombreux codes qui vous aident à ressentir les statistiques dans des exemples réels.
Pensez Python par Allen B. Downey
Manuel de Python Data Science
Le lien suivant peut également aider:
la source
Introduction à l'algèbre linéaire https://math.mit.edu/~gs/linearalgebra/ est un bon point de départ. Assurez-vous que vous êtes bon avec la théorie des probabilités, l'algèbre linéaire et les statistiques. Une connaissance très approfondie peut ne pas être nécessaire, mais une bonne connaissance est requise.
la source
Avant de faire ma maîtrise en analytique, mes aînés m'ont suggéré de parcourir ces deux livres pour en savoir plus sur l'apprentissage automatique et les statistiques.
À savoir:
Si vous ne trouvez pas ces livres en ligne, faites-le moi savoir partagera le lien, je les ai sur mon lecteur. Ces livres m'ont aidé à comprendre les bases des statistiques avec des exemples expliqués en termes simples.
Si vous recherchez des cours en ligne, faites-le moi savoir pour vous suggérer quelques bons cours (la plupart d'entre eux sont gratuits).
la source
Je ne peux pas dire à partir de votre question à quel point vous êtes habile en mathématiques ou où votre apprentissage s'arrête. Je suppose que puisque vous êtes ingénieur en logiciels informatiques, vous connaissez l'algèbre, la géométrie et peut-être le calcul.
Je vous recommande de commencer votre apprentissage en lisant les statistiques et en comprenant des concepts tels que les descriptifs, l'analyse exploratoire des données, la corrélation, les distributions, etc. Je vois que vous préférez les livres plutôt que les vidéos, je vous rencontrerai donc à mi-chemin et vous fournirai quelques livres en ligne, ainsi qu'un ou deux livres que vous pouvez acheter sur papier.
Tout d'abord, je recommanderais le programme d'études supérieures en ligne de Penn State en statistiques . Vous pouvez explorer chacun de leurs cours en utilisant le menu de gauche. Une fois que vous avez sélectionné un cours, faites défiler la page Web du cours vers le bas et cliquez sur le lien qui indique "notes de cours en ligne". Les notes de cours pour ces cours sont bien plus que des notes et se lisent comme des livres complets. Ils sont très instructifs. Consultez également le programme de cours de premier cycle en ligne de Penn State en statistiques , au cas où vous trouveriez quelque chose de trop avancé dans les cours de deuxième cycle et voudriez une explication "plus simple".
Deuxièmement, passez en revue le Handbook of Biological Statistics de John H. McDonald. Ne laissez pas le titre vous tromper; ce livre est une excellente introduction aux statistiques et à l'analyse des données applicables à n'importe quel domaine.
Troisièmement, passez en revue Le petit manuel de statistiques de Gerard Dallal. Encore une fois, ne laissez pas le titre vous tromper; ce livre est un autre joyau qui vous guide à travers quelques principes fondamentaux de statistiques importantes.
Quatrièmement, consultez le livre Think Stats d'Allen Downey. Il existe une version gratuite en ligne d'une édition antérieure; l'édition la plus récente que vous devrez acheter. Cela en vaut la peine, surtout si vous travaillez en Python. Dans ce livre, l'auteur vous enseigne les statistiques et l'analyse de données à l'aide de Python pour analyser des ensembles de données (jouets) du monde réel. C'est un très bon livre à travailler.
Enfin, consultez Data Science from Scratch de Joel Grus. Ce livre se concentre davantage sur l'analyse des données (plutôt que sur les principes fondamentaux des statistiques) et met davantage l'accent sur l'apprentissage automatique et la modélisation. Il utilise Python (et la pile de science des données Python) pour vous guider dans l'analyse et la réalisation d'analyses prédictives sur des ensembles de données (jouets) du monde réel. Un autre grand livre à travailler.
la source
Gardez à l'esprit que même si j'ai une maîtrise en statistique appliquée, je vais vous donner une réponse très simple: suivre un cours sur les probabilités.
La plupart des cadres de programmation ML modernes prennent une grande majorité des mathématiques de la science des données; vous n'en aurez vraiment pas besoin dans la plupart des scénarios. Mais vous aurez toujours besoin de la capacité de comprendre vos résultats et la majorité des résultats sont exprimés en probabilités. Si j'étais nouveau dans la science des données, je prendrais un (bref) cours sur les probabilités, chercherais à comprendre ce que signifient vraiment les proportions et les pourcentages et ensuite je travaillerais pour connaître un cadre (comme Tensorflow) vraiment, vraiment bien. Si vous pouvez le faire, vous pouvez écrire des algorithmes vraiment intéressants et ne pas être obsédé par les mathématiques.
la source