Je recherche un site internet ou un livre où plusieurs exemples pratiques sont donnés pas à pas, expliquant comment ils choisissent les fonctionnalités pertinentes, la procédure de sélection des modèles, etc ...
Je recherche un site internet ou un livre où plusieurs exemples pratiques sont donnés pas à pas, expliquant comment ils choisissent les fonctionnalités pertinentes, la procédure de sélection des modèles, etc ...
Si vous voulez un livre orienté application, pensez à l' apprentissage automatique basé sur modèle de Christopher Bishop . Il a des livres plus techniques qui sont bien considérés.
Si vous recherchez beaucoup de code, la programmation probabiliste et les méthodes bayésiennes pour les pirates sont une option.
Un autre livre d' introduction avec un penchant plus statistique est une introduction à l' apprentissage statistique avec des applications en R . Encore une fois, les auteurs ont une version technique bien considérée du livre.
J'ai eu la même question il y a quelques semaines.
J'ai personnellement trouvé le Python pour l'analyse de données d' O'Reilly très utile pour apprendre les bases. Le livre suppose que vous avez une certaine expérience de programmation python, mais il a également une annexe à l'arrière pour passer en revue les bases.
L'auteur vous donne une grande variété d'exemples du monde réel (pas Monty Python) au début que vous pouvez créer dans les premiers chapitres, puis entre en détail sur chaque chose au fur et à mesure que le livre avance, en développant vos connaissances.
J'ai trouvé les instructions très faciles et pas à pas. Mon professeur qui est mon guide dans tout cela a été impressionné par la rapidité avec laquelle j'ai appris.
J'ai également entendu de bonnes choses à propos de Kaggle.
La science des données dans le cloud avec Microsoft Azure Machine Learning et R est un manuel gratuit qui fonctionne à travers un exemple en détail. Ne vous laissez pas rebuter par les outils particuliers utilisés car vous n'en avez pas besoin pour tirer un avantage du livre.
Un autre que j'ai apprécié est la programmation de l'intelligence collective, qui passe également en revue un certain nombre de projets en détail, y compris la partie de grattage Web sur laquelle la plupart des livres se superposent.
Je peux recommander cette collection de cahiers Ipython qui comprend des cahiers commentés Data Science, Statistics et Machine Learning.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
Un endroit où vous pourriez trouver des explications étape par étape intéressantes est le tutoriel Kaggle et les interviews des gagnants . Souvent, les gens publieront un résumé détaillé de leur approche.
L'un des meilleurs livres que j'ai rencontré est Machine Learning in Python de Sebastian Raschka. Exemples faciles, explication étape par étape et juste quantité de mathématiques.
La structure du livre couvre l'ensemble du processus, du nettoyage des données à l'assemblage et à l'évaluation.
la source
Jettes un coup d'oeil à :
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
Cela comprend un didacticiel étape par étape qui vous donnera une idée de l'ensemble du processus d'exploration de données, d'analyse de données et de construction d'un modèle prédictif.
Les explications concernant l'exploration des données et l'ingénierie des fonctionnalités (comment choisir les fonctionnalités pertinentes) sont ici:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Voir les 5 premiers jeux de données ici qui ont des tutoriels et travaillez dessus pour obtenir une expérience pratique:
https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/
Jetez également un œil à:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
où il utilise plusieurs modèles sur un seul ensemble de données qui vous donnera une compréhension de base des différents modèles.
Pour en savoir plus sur la sélection des modèles, jetez un œil à ceci:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
Le lien ci-dessus contient des réponses données par des personnes travaillant dans le domaine.
Pour obtenir des informations sur différents ensembles de données, vous pouvez toujours vous connecter à kaggle et passer par des concours et jeter un œil à la large gamme d'ensembles de données, où vous avez accès au code des personnes dans les noyaux. Les forums de Kaggle sont utiles lorsque les gens discutent de l'utilisation de différents modèles pour un problème et de leur approche.
https://www.kaggle.com/
la source