J'ai trouvé que Project Euler http://projecteuler.net/ était incroyablement utile pour apprendre les langages de programmation. Existe-t-il un site similaire pour l'apprentissage automatique?
J'ai vu http://www.kaggle.com/ , mais il n'est pas aussi accessible aux débutants que Project Euler.
Réponses:
Bien que les enjeux soient plus importants que pour Project Euler, comme vous l'avez souligné, Kaggle est une excellente source de données à utiliser dans vos propres expériences. Beaucoup de leurs concours nécessitent que vous soyez connecté pour accéder aux ensembles de données (pour les accords juridiques, etc.), mais si vous ne terminez pas une entrée, il n'y a pas de pénalité à ma connaissance.
Cela étant dit, si vous recherchez des ensembles de données spécifiques aux tests de procédures statistiques, comme ceux de Princeton , vous pouvez tester les données sur différentes architectures de réseau et les comparer à une régression simple, etc. comme référence.
Voir également ici pour une liste complète, qui comprend toutes les données de traitement du langage naturel de Google .
Ainsi, Project Euler fournit un excellent service avec des problèmes spécifiques, mais dans le cas de l'apprentissage automatique, vous pouvez utiliser les ensembles de données existants avec une architecture de votre création et comparer les "réponses" aux conclusions qui sont présentées en ligne ou dans des documents de recherche.
la source
L'UCI est bien connu dans la communauté du machine learning pour son référentiel de jeux de données. De nombreux articles de revues incluent les résultats de leurs techniques sur certains ensembles de données UCI, afin que vous puissiez vous essayer et voir comment vous faites.
la source
Que diriez-vous: http://www.ml-class.org/ ? Il a une bonne introduction et quelques excersises de programmation. AFAIK Euler a des exemples beaucoup plus sophistiqués, mais la classe ml est toujours un bon début.
Comme il a été souligné dans les commentaires, ce cours a la prochaine édition: http://jan2012.ml-class.org/#
la source