Comme la science doit être reproductible, par définition, il est de plus en plus reconnu que les données et le code sont un élément essentiel de la reproductibilité, comme discuté par la table ronde de Yale pour le partage des données et du code .
En examinant un manuscrit pour une revue qui ne nécessite pas de partage de données et de code, puis-je demander que les données et le code soient mis à disposition
- pour moi au moment de l'examen
- publiquement au moment de la publication (la revue prend en charge les suppléments)
aussi, comment pourrais-je formuler une telle demande?
mise à jour : bien que je m'intéresse au cas général, ce cas particulier consiste en une méta-analyse avec toutes les données précédemment publiées, et le code est de simples modèles linéaires en SAS
note de côté la capacité de faire des déductions croisées (comme c'est le but de la méta-analyse) serait grandement améliorée si plus d'études fournissaient des données brutes
mise à jour 2 :
J'ai demandé les données et le code à l'éditeur à des fins d'examen, l'éditeur a jugé la demande raisonnable et j'ai reçu le matériel demandé (suffisant mais avec des noms de variables cryptiques, pas de métadonnées et quelques commentaires en ligne) dans la journée.
la source
Réponses:
En ce qui concerne l'obtention de données en tant qu'évaluateur, vous y avez droit si vous en avez besoin pour terminer correctement votre examen. Plus d'examinateurs devraient demander des données et les évaluer. De nombreuses revues ont des politiques qui peuvent nécessiter les données et le code d'analyse à des fins d'examen.
La disponibilité au moment de la publication n'est pas claire pour moi. Il semble que vous disiez que vous voulez forcer le fait que les données soient rendues publiques comme condition de publication. C'est une mauvaise idée si ce n'est pas déjà la politique du journal. Vous faites de la publication une cible mouvante injuste. Ils ont soumis en s'attendant à ce que ce ne soit pas une exigence et que vous, ni l'éditeur, devriez changer le jeu.
À l'insu de nombreux chercheurs financés par des fonds publics, ils sont tenus de rendre leurs données publiques. Par exemple, la plupart des subventions du NIH contiennent des clauses dans lesquelles le chercheur doit communiquer ses données. La plupart des organismes subventionnaires gouvernementaux ont des clauses de partage de données qui obligent le chercheur à partager ce qu'il trouve (peut-être que la force est un peu forte étant donné qu'il est très difficile de perdre une subvention par-dessus ... peut-être même de perdre le renouvellement). Le public a payé les données, donc le public y a droit --- dans le cas de la recherche humaine, il a le droit de les rendre anonymisées.
Certaines des données les plus coûteuses et sensibles à collecter, les données de l'IRMf humaine, sont également parmi les plus communément rendues publiques. Non seulement PLoS, mais les principales revues du domaine nécessitent la soumission des données et maintiennent une banque de données accessible au public. Je pense que cela en dit long sur les personnes qui s'opposent pour des raisons de coût (c'est très cher) et de confidentialité (ce sont les données humaines de petites études et parfois des populations cliniques uniques qui pourraient être très sensibles). Ce sont des raisons qui rendent ces données plus précieuses pour le public. Les chercheurs qui retiennent de telles données ne rendent pas service aux personnes qui les ont achetées (tout le monde) et ont besoin d'une leçon sur leurs responsabilités en dehors de leur petit laboratoire et concours de publication.
Si la recherche était financée par le secteur privé, véritablement financée par le secteur privé, alors bonne chance.
la source
Traiter les deux situations séparément:
En tant que critique: Oui, je pense que vous auriez des raisons de demander à voir les données ou le code. Mais si j'étais vous, je me préparerais à voir des choses comme du code épuré ou un sous-échantillon des données. Les gens mettent en œuvre des recherches futures qui ne sont pas signalées dans ce document dans leur code tout le temps, et vous n'avez aucun droit sur ce code. Étant donné que je fais principalement de la recherche biomédicale, je serais également prêt à devoir faire face à certains accords d'utilisation des données assez restrictifs.
Dans la revue elle-même: Non. Si un chercheur veut reproduire mes résultats, il peut me contacter lui-même pour demander du code - c'est pourquoi nous avons des auteurs correspondants. Pour les données, absolument pas, en aucun cas. Mes données sont régies par la CISR et les accords de confidentialité - elles ne seront pas simplement rendues publiques. Si je veuxun ensemble de données public, je pourrais simuler un ensemble de données avec des propriétés similaires (c'est-à-dire les données réseau "Faux-Mesa" disponibles dans l'un des packages réseau pour R), mais en tant que réviseur, vous n'avez aucun appel à forcer . S'il s'agit d'une exigence à l'échelle de la revue, les auteurs savaient que leurs données / code seraient publics lors de leur soumission, mais si ce n'est pas le cas, alors non. Votre rôle est d'évaluer la qualité du document lui-même (d'où mon accord avec lui aux fins de l'examen), et non d'utiliser votre capacité à contribuer à l'acceptation / au rejet du document pour pousser ce qui est essentiellement un point philosophique / politique. en dehors de la portée de la revue.
Au mieux, je mettrais un "J'invite fortement les auteurs à rendre leur code et leurs données disponibles, si possible" dans vos commentaires, mais je ne le formulerais pas plus fort que cela, et je ne le mettrais pas dans la liste officielle des «choses que je pense devoir être corrigées avant que cela ne voit le jour».
la source
Comme John le dit, la disponibilité des données pour les examinateurs devrait être une évidence; un examen attentif devrait inclure la reproduction de l'analyse et, à ce titre, nécessite l'accès aux données.
En ce qui concerne la disponibilité publique des données après leur publication, je dirais que la bataille devrait être menée avec la revue en général plutôt qu'avec une soumission spécifique.
De manière plus générale, les organismes de financement et les CISR sont de plus en plus conscients que le partage des données est une composante à la fois scientifique et éthique de la recherche. En augmentant la disponibilité pour une nouvelle analyse qui pourrait produire de nouveaux résultats de rapports erronés corrects, le partage des données augmente les avantages potentiels pour la recherche, modifiant ainsi le compromis coût / avantage au profit des participants à la recherche. Il est certainement nécessaire d'informer les participants de la possibilité que leurs données soient partagées, et il est également nécessaire de mettre en place des garanties pour éviter un risque accru d'identification pour les participants, mais cela peut être réalisé dans la plupart des circonstances. Dans mes propres recherches, j'assure aux participants (et à ma CISR) que (1) les données seront stockées dans un format crypté robuste (mis à jour au fur et à mesure que la technologie de décryptage progresse),
la source
Je n'ai aucune expérience à ce sujet, mais il me semble que vous pourriez être en mesure d'insister sur # 1 dans le cadre de votre propre diligence raisonnable dans l'examen de leurs résultats. Je ne vois pas comment vous pouvez insister sur le # 2, cependant.
la source