J'interviewe des personnes pour un poste de développeur / chercheur d'algorithmes dans un contexte de statistiques / d'apprentissage automatique / d'exploration de données.
Je recherche des questions à poser pour déterminer, en particulier, la familiarité, la compréhension et la fluidité d'un candidat avec la théorie sous-jacente, par exemple les propriétés de base de l'attente et de la variance, certaines distributions communes, etc.
Ma question actuelle est la suivante: «Il y a une quantité inconnue que nous aimerions estimer. À cette fin, nous avons des estimateurs Y 1 , Y 2 , … , Y n qui, étant donné X , sont tous sans biais et indépendants, et chacun a une variance connue σ 2 i , différente pour chacun. Trouver l'estimateur optimal Y = f ( Y 1 , … , Y n ) qui est sans biais et a une variance minimale. "
Je m'attendrais à ce que tout candidat sérieux le gère facilement (compte tenu du temps nécessaire pour effectuer les calculs), et pourtant je suis surpris du nombre de candidats censés provenir de domaines pertinents qui ne parviennent pas à faire le moindre progrès. Je considère donc que c'est une bonne question discriminatoire. Le seul problème avec cette question est qu'elle n'en est qu'un.
Quelles autres questions peuvent être utilisées pour cela? Sinon, où puis-je trouver une collection de ces questions?
la source
Réponses:
Que voulez-vous que votre développeur de statistiques fasse?
L'armée américaine dit "entraînez-vous, vous vous battrez, car vous vous battrez comme si vous étiez entraîné". Testez-les sur ce que vous voulez qu'ils fassent toute la journée. Vraiment, vous voulez qu'ils "créent de la valeur" ou "gagnent de l'argent" pour l'entreprise.
Boss 101
Pensez "montrez-moi l'argent".
Remarque: Si votre question de manipulation symbolique ne se connecte pas proprement à «l'argent», vous vous posez peut-être la mauvaise question.
Il y a 3 choses que chaque employé doit faire pour être un employé:
Si vous ne les obtenez pas solides, aucune autre réponse ne vous fera du bien.
Si vous pouvez les remplacer par un bon logiciel ou un adolescent bien formé, vous devrez éventuellement le faire et cela vous coûtera.
Données 101
Ce qu'ils devraient pouvoir faire:
(régression / ajustement comprenant des modèles linéaires, glm, base radiale,
équations de différence), est-il vrai que "x "(test d'hypothèse), de combien d'échantillons ai-je besoin (échantillonnage d'acceptation), comment puis-je obtenir le plus de
données provenant d'expériences peu nombreuses / bon marché / efficaces (conception statistique de l'
expérience) - avertissement, je suis ingénieur et non statisticien Vous pourriez leur demander la question "quelles sont les différentes tâches fondamentales, et comment testez-vous que le statisticien peut les faire efficacement et correctement?
Ils devraient pouvoir lire à partir de csv, xlsx (excel), SQL et des
images. (HDF5, Rdata) Si vous avez un format personnalisé, ils devraient
pouvoir le lire et travailler avec les outils rapidement et
efficacement. Ils doivent connaître la force / la faiblesse du format. CSV est une utilisation rapide, existe depuis toujours, prototype rapide, mais gonflé, inefficace et lent à exécuter.
personnes disent "il y a des mensonges, des putains de mensonges et des statistiques", mais pas dans mon
entreprise. La même bonne entrée donne la même bonne sortie. La sortie n'est pas un nombre, c'est toujours une décision commerciale qui informe une
action technique et aboutit à un résultat commercial. Différents tests peuvent régler le cadran à 5,5 ou 6,5, mais la capacité est toujours supérieure à 1,33.
décideurs et / ou les développeurs de sbires, et / ou eux-mêmes en un an, peuvent
comprendre avec le moins d'erreurs. Une belle chose est de pouvoir l'expliquer pour que votre grand-mère l'obtienne. Ce ( lien ) est ma réponse, mais j'aime ça.
Zingers analytiques:
Je pense que les questions impossibles sont grandes. Ils sont impossibles pour une raison. Être capable de savoir si quelque chose est impossible au départ est une bonne chose. Savoir pourquoi, avoir des moyens de l'engager ou être capable de poser une question différente peut être mieux.
Autres questions CV. ( lien ) Sur reddit. ( lien ) autres ( lien )
BTW: c'était une bonne question. Je devrais peut-être mettre à jour cette réponse au fil du temps.
la source