Science des données

23
Comment utiliser la sortie de GridSearch?

Je travaille actuellement avec Python et Scikit learn à des fins de classification, et en lisant autour de GridSearch, j'ai pensé que c'était un excellent moyen d'optimiser mes paramètres d'estimateur pour obtenir les meilleurs résultats. Ma méthodologie est la suivante: Divisez mes données en...

22
Partage des blocs-notes Jupyter au sein d'une équipe

Je voudrais mettre en place un serveur qui pourrait prendre en charge une équipe de science des données de la manière suivante: être un point central pour le stockage, la gestion des versions, le partage et éventuellement l'exécution des blocs-notes Jupyter. Quelques propriétés souhaitées:...

22
Comment gérez-vous les attentes au travail?

Avec tout le brouhaha autour de la science des données, de l'apprentissage automatique et de toutes les histoires de réussite, il y a beaucoup d'attentes à la fois justifiées et exagérées des Data Scientists et de leurs modèles prédictifs. Ma question aux statisticiens, experts en apprentissage...

22
Quelle est une meilleure entrée pour Word2Vec?

Cela ressemble plus à une question générale de PNL. Quelle est l'entrée appropriée pour former l'intégration d'un mot, à savoir Word2Vec? Est-ce que toutes les phrases appartenant à un article devraient être un document séparé dans un corpus? Ou chaque article doit-il être un document dans ledit...