Existe-t-il un projet Euler-like pour l'apprentissage automatique?

32

J'ai trouvé que Project Euler http://projecteuler.net/ était incroyablement utile pour apprendre les langages de programmation. Existe-t-il un site similaire pour l'apprentissage automatique?

J'ai vu http://www.kaggle.com/ , mais il n'est pas aussi accessible aux débutants que Project Euler.

B Seven
la source
1
+1 C'est une très belle question, mais est-ce que je manque quelque chose? Les réponses impliquent principalement des liens vers des ensembles de données difficiles et des cours ouverts. D'un autre côté, ProjectEuler consiste en des questions difficiles de différents niveaux et vous augmentez vos compétences pendant que vous les résolvez. Et vous pouvez voir les solutions des autres après avoir résolu le problème. Il est similaire à pythonchallenge.com je pense. Demandez-vous quelque chose comme ça? Une clarification serait très agréable.
Petrichor
1
Sauf Kaggle, il y a aussi TunedIt .

Réponses:

13

Bien que les enjeux soient plus importants que pour Project Euler, comme vous l'avez souligné, Kaggle est une excellente source de données à utiliser dans vos propres expériences. Beaucoup de leurs concours nécessitent que vous soyez connecté pour accéder aux ensembles de données (pour les accords juridiques, etc.), mais si vous ne terminez pas une entrée, il n'y a pas de pénalité à ma connaissance.

Cela étant dit, si vous recherchez des ensembles de données spécifiques aux tests de procédures statistiques, comme ceux de Princeton , vous pouvez tester les données sur différentes architectures de réseau et les comparer à une régression simple, etc. comme référence.

Voir également ici pour une liste complète, qui comprend toutes les données de traitement du langage naturel de Google .

Ainsi, Project Euler fournit un excellent service avec des problèmes spécifiques, mais dans le cas de l'apprentissage automatique, vous pouvez utiliser les ensembles de données existants avec une architecture de votre création et comparer les "réponses" aux conclusions qui sont présentées en ligne ou dans des documents de recherche.

Jonsca
la source
7

L'UCI est bien connu dans la communauté du machine learning pour son référentiel de jeux de données. De nombreux articles de revues incluent les résultats de leurs techniques sur certains ensembles de données UCI, afin que vous puissiez vous essayer et voir comment vous faites.

Michael McGowan
la source
6

Que diriez-vous: http://www.ml-class.org/ ? Il a une bonne introduction et quelques excersises de programmation. AFAIK Euler a des exemples beaucoup plus sophistiqués, mais la classe ml est toujours un bon début.

Comme il a été souligné dans les commentaires, ce cours a la prochaine édition: http://jan2012.ml-class.org/#

jb.
la source
1
Réponse intéressante. Je viens de terminer le cours et c'était exceptionnel. Ils recommencent à jan2012.ml-class.org ...
B Seven
Je suppose que beaucoup de gens ici viennent de ce cours. Je n'ai pas eu le temps de le faire la dernière fois, alors je vais essayer maintenant :)
jb.
Je le recommande fortement. Vaut vraiment le temps et les efforts.
B Seven