La reproductibilité est devenue de plus en plus importante dans la recherche en science informatique. (Par exemple, consultez cet article de Roger Peng dans Science ; je connais également d'autres articles et sites Web de ce type.) Cependant, je ne sais pas exactement combien d'informations je devrais inclure avec un article de revue (ou en ligne) pour faire mes recherches informatiques reproductibles (en supposant qu'il n'y a pas d'autres obstacles, comme les accords de propriété intellectuelle). Existe-t-il des lignes directrices, et sinon, les gens pourraient-ils suggérer les mesures que les chercheurs devraient prendre pour rendre leur recherche en science informatique reproductible?
Il serait particulièrement utile dans les réponses de mettre en œuvre ces suggestions - des flux de travail, essentiellement. Les flux de travail indépendants du système ou basés sur Linux sont préférables. De plus, discuter de toute expérience personnelle pertinente que vous avez vécue serait également utile.
Dans mon cas particulier, j'écris un article théorique avec quelques exemples de calculs suffisamment simples pour pouvoir être effectués dans MATLAB. Je pense que dans ce cas, y compris le script MATLAB, ainsi que de noter la version spécifique de MATLAB sur ma machine, serait suffisant pour assurer la reproductibilité. Cependant, je suis certain qu'il existe des scénarios plus compliqués, et des conseils sur la façon d'effectuer des recherches reproductibles seraient très utiles à connaître pour de futurs projets.
la source
La plupart des revues ne sont pas configurées pour cela de manière formelle, mais nous avons récemment fondé l'Archive of Numerical Software qui est spécifiquement destiné à inclure le code source et tout ce qui est nécessaire dans l'article. Vérifiez-le: http://journals.tdl.org/ans Les soumissions sont les bienvenues!
la source
Dans
Stodden, V. 2009. «Le cadre juridique de la recherche scientifique reproductible» . CiSE .
Victoria Stodden recommande de publier l'intégralité du "recueil de recherche" et énumère les éléments suivants à la p. 38:
la source
Au moins, le code source et les données que vous avez utilisées pour effectuer vos expériences devraient être accessibles quelque part. Ajoutez des instructions pour créer votre code si nécessaire. Il y a vraiment si peu de revues en libre accès qu'il n'y a pas de règle ouverte et établie.
la source
Je travaille pour Elsevier. Mon entreprise a commencé à utiliser le cadre Collage (développé en réponse au Grand défi du papier exécutable) dans les numéros de revues pour permettre aux auteurs d'inclure toutes les données et le code nécessaires pour reproduire les résultats et les chiffres dans leurs articles. Cette fonctionnalité permet aux lecteurs de reproduire plus facilement les résultats rapportés dans l'article et de réutiliser le matériel publié pour leurs propres recherches. Collage prend en charge une grande variété de logiciels libres et propriétaires; plus d'informations peuvent être trouvées dans la vidéo d'information ici et sur le site Web Collage Authoring Environment .
la source