Qui suivre sur github pour en savoir plus sur les meilleures pratiques en matière d'analyse de données?

28

Il est utile d'étudier le code d'analyse des données des experts. J'ai récemment parcouru github et il y a un certain nombre de personnes qui partagent du code d'analyse de données là-bas. Cela inclut quelques packages R (qui bien sûr sont disponibles directement auprès du CRAN), mais aussi plusieurs exemples de recherches reproductibles, en particulier en utilisant R ( voir cette liste R sur github ).

  • Qui sont les bonnes personnes à suivre sur github pour en savoir plus sur les meilleures pratiques en matière d'analyse de données?
  • Facultativement, quel type de code partagent-ils et pourquoi est-ce utile?
Jeromy Anglim
la source

Réponses:

18

Hadley Wickham . Il a plusieurs projets d'analyse de données exploratoires sur Github que vous pouvez regarder (par exemple, "data-baby-names"), et compte tenu de l'extraordinaire de ggplot2 / plyr / reshape, j'ai une confiance par défaut (mais certes aveugle) dans son meilleur pratiques, notamment en ce qui concerne ses propres colis.

De plus, vous obtenez rapidement un aperçu des autres projets sur lesquels il travaille!

raegtin
la source
5
(+1) Il travaille également sur un ensemble de tutoriels sur le développement Advanced R , très pratique!
chl
@ Jeromy En fait, il semble que ce soit simplement un moyen de rédiger son futur manuel (consultez les derniers tweets de HW).
chl
9

Je suis également le référentiel GitHub de John Myles White . Il existe plusieurs projets orientés données, mais aussi des trucs intéressants pour les développeurs R:

  • ProjectTemplate , un système de gabarits pour la construction d'un projet R;
  • log4r , un système de journalisation.
chl
la source