Les projets de science des données expliqués étape par étape?

10

Je recherche un site internet ou un livre où plusieurs exemples pratiques sont donnés pas à pas, expliquant comment ils choisissent les fonctionnalités pertinentes, la procédure de sélection des modèles, etc ...

cpumar
la source

Réponses:

2
Emre
la source
1

J'ai eu la même question il y a quelques semaines.

J'ai personnellement trouvé le Python pour l'analyse de données d' O'Reilly très utile pour apprendre les bases. Le livre suppose que vous avez une certaine expérience de programmation python, mais il a également une annexe à l'arrière pour passer en revue les bases.

L'auteur vous donne une grande variété d'exemples du monde réel (pas Monty Python) au début que vous pouvez créer dans les premiers chapitres, puis entre en détail sur chaque chose au fur et à mesure que le livre avance, en développant vos connaissances.

J'ai trouvé les instructions très faciles et pas à pas. Mon professeur qui est mon guide dans tout cela a été impressionné par la rapidité avec laquelle j'ai appris.

J'ai également entendu de bonnes choses à propos de Kaggle.

Brian B.
la source
1

La science des données dans le cloud avec Microsoft Azure Machine Learning et R est un manuel gratuit qui fonctionne à travers un exemple en détail. Ne vous laissez pas rebuter par les outils particuliers utilisés car vous n'en avez pas besoin pour tirer un avantage du livre.

Un autre que j'ai apprécié est la programmation de l'intelligence collective, qui passe également en revue un certain nombre de projets en détail, y compris la partie de grattage Web sur laquelle la plupart des livres se superposent.

Flet
la source
1

Un endroit où vous pourriez trouver des explications étape par étape intéressantes est le tutoriel Kaggle et les interviews des gagnants . Souvent, les gens publieront un résumé détaillé de leur approche.

anthr
la source
Votre lien est rompu.
Pierre
@Pierre - vient de le corriger.
anthr
0

L'un des meilleurs livres que j'ai rencontré est Machine Learning in Python de Sebastian Raschka. Exemples faciles, explication étape par étape et juste quantité de mathématiques.

La structure du livre couvre l'ensemble du processus, du nettoyage des données à l'assemblage et à l'évaluation.

HonzaB
la source
0

Jettes un coup d'oeil à :

https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/

Cela comprend un didacticiel étape par étape qui vous donnera une idée de l'ensemble du processus d'exploration de données, d'analyse de données et de construction d'un modèle prédictif.

Les explications concernant l'exploration des données et l'ingénierie des fonctionnalités (comment choisir les fonctionnalités pertinentes) sont ici:

https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/

Voir les 5 premiers jeux de données ici qui ont des tutoriels et travaillez dessus pour obtenir une expérience pratique:

https://www.analyticsvidhya.com/blog/2016/10/17-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

Jetez également un œil à:

http://machinelearningmastery.com/machine-learning-in-python-step-by-step/

où il utilise plusieurs modèles sur un seul ensemble de données qui vous donnera une compréhension de base des différents modèles.

Pour en savoir plus sur la sélection des modèles, jetez un œil à ceci:

https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection

Le lien ci-dessus contient des réponses données par des personnes travaillant dans le domaine.

Pour obtenir des informations sur différents ensembles de données, vous pouvez toujours vous connecter à kaggle et passer par des concours et jeter un œil à la large gamme d'ensembles de données, où vous avez accès au code des personnes dans les noyaux. Les forums de Kaggle sont utiles lorsque les gens discutent de l'utilisation de différents modèles pour un problème et de leur approche.

https://www.kaggle.com/

RRRK
la source