Yann LeCun a mentionné dans son AMA qu'il considère qu'il est très important d'avoir un doctorat pour obtenir un emploi dans une grande entreprise.
J'ai une maîtrise en statistique et mon premier cycle était en économie et mathématiques appliquées, mais je suis maintenant à la recherche de programmes de doctorat en ML. La plupart des programmes disent qu'il n'y a pas de cours de CS absolument nécessaires; cependant, j'ai tendance à penser que la plupart des étudiants acceptés ont au moins une formation très solide en CS. Je travaille actuellement en tant que data scientist / statistician mais mon entreprise paiera les cours. Dois-je suivre des cours d'introduction en génie logiciel dans mon université locale pour devenir un meilleur candidat? Quels autres conseils avez-vous pour quelqu'un qui postule à des programmes de doctorat en dehors du domaine CS?
edit: J'ai pris quelques MOOCs (Machine Learning, Recommender Systems, NLP) et code R / python au quotidien. J'ai beaucoup d'expérience en codage avec les langages statistiques et implémente quotidiennement des algorithmes ML. Je suis plus préoccupé par les choses que je peux mettre sur les applications.
Réponses:
Si j'étais vous, je prendrais un MOOC ou deux (par exemple, Algorithmes, Partie I , Algorithmes, Partie II , Principes de programmation fonctionnelle en Scala ), un bon livre sur les structures de données et les algorithmes, puis coder autant que possible. Vous pouvez par exemple implémenter des statistiques ou des algorithmes ML; ce serait une bonne pratique pour vous et utile à la communauté.
Pour un programme de doctorat, cependant, je m'assurerais également de bien connaître le type de mathématiques qu'ils utilisent. Si vous voulez voir à quoi cela ressemble au fond, parcourez les articles au JMLR . Cela vous permettra de vous calibrer par rapport à la théorie; pouvez-vous en quelque sorte suivre les maths?
Oh, et vous n'avez pas besoin d'un doctorat pour travailler dans les meilleures entreprises, sauf si vous souhaitez rejoindre des départements de recherche comme le sien. Mais alors vous passerez plus de temps à faire du développement, et vous aurez besoin de bonnes compétences en codage ...
la source
Votre temps serait probablement mieux consacré à Kaggle qu'à un programme de doctorat. Lorsque vous lisez les histoires des gagnants ( blog Kaggle ), vous verrez qu'il faut beaucoup de pratique et les gagnants ne sont pas seulement des experts d'une seule méthode.
D'un autre côté, être actif et avoir un plan dans un programme de doctorat peut vous procurer des connexions que vous n'auriez probablement pas obtenues autrement.
Je suppose que la vraie question est pour vous - quelles sont les raisons de vouloir un emploi dans une grande entreprise?
la source
Vous avez déjà un Master en statistique, c'est super! En général, je suggère aux gens de prendre autant de statistiques que possible, en particulier l'analyse des données bayésiennes.
Selon ce que vous voulez faire avec votre doctorat, vous bénéficierez de cours de base dans les disciplines de votre domaine d'application. Vous avez déjà l'économie, mais si vous voulez faire de la science des données sur le comportement social, alors des cours de sociologie seraient utiles. Si vous voulez travailler dans la prévention de la fraude, alors un cours sur les transactions bancaires et financières serait bien. Si vous souhaitez travailler dans le domaine de la sécurité de l'information, suivre quelques cours de sécurité serait une bonne chose.
Il y a des gens qui soutiennent qu'il n'est pas utile pour les scientifiques des données de passer du temps sur des cours de sociologie ou d'autres disciplines. Mais considérons le cas récent du projet Google Flu Trends. Dans cet article, leurs méthodes ont été fortement critiquées pour avoir commis des erreurs évitables. Les critiques l'appellent "l'orgueil du Big Data".
Il y a une autre raison de renforcer les forces dans les disciplines des sciences sociales: l'avantage concurrentiel personnel. Avec la ruée des programmes de diplômes universitaires, des programmes de certificat et des MOOC, il y a une ruée folle d'étudiants dans le domaine de la science des données. La plupart sortiront avec des capacités pour les méthodes et outils de base de Machine Learning. Les titulaires de doctorat auront plus de connaissances approfondies et théoriques, mais ils sont tous en concurrence pour les mêmes types d'emplois, offrant les mêmes types de valeur. Avec ce flot de diplômés, je m'attends à ce qu'ils ne soient pas en mesure de commander des salaires plus élevés.
Mais si vous pouvez vous différencier par une combinaison d'éducation formelle et d'expérience pratique dans un domaine et un domaine d'application particuliers, vous devriez pouvoir vous démarquer de la foule.
(Contexte: je suis dans un programme de doctorat en sciences sociales computationnelles, qui se concentre fortement sur la modélisation, le calcul évolutif et les disciplines des sciences sociales, et moins sur le ML et d'autres sujets d'analyse de données empiriques).
la source
Je suis heureux que vous ayez également trouvé la page AMA de Yann LeCun, c'est très utile.
Voici mes opinions
Q: Dois-je suivre des cours d'introduction en génie logiciel dans mon université locale pour devenir un meilleur candidat?
R: Non, vous devez suivre plus de cours de mathématiques. Ce n'est pas le truc appliqué qui est difficile, c'est le truc théorique. Je ne sais pas ce que propose ton école. Prenez des cours de mathématiques théoriques, ainsi que des cours d'informatique.
Q: Quels autres conseils avez-vous pour quelqu'un qui postule à des programmes de doctorat en dehors du domaine CS?
R: Quelle relation étroite recherchez-vous? Sans question précise, il est difficile de donner une réponse précise.
la source
Vous avez également la possibilité de rejoindre un programme de doctorat en école de commerce et école d'information. Il y a aussi des professeurs quantitatifs et des scientifiques des données dans les écoles de commerce et les écoles d'information (à propos des États-Unis, je suis sûr qu'il y a beaucoup d'écoles). De cette façon, vous êtes qualifié ou même surqualifié en termes de compétences quantitatives et techniques et vous pouvez passer votre temps à renforcer d'autres compétences.
la source