A Realistic Guide to Making Data Available Alongside Code to Improve Reproducibility

Authors : Nicholas J Tierney, Karthik Ram

Data makes science possible. Sharing data improves visibility, and makes the research process transparent. This increases trust in the work, and allows for independent reproduction of results.

However, a large proportion of data from published research is often only available to the original authors. Despite the obvious benefits of sharing data, and scientists’ advocating for the importance of sharing data, most advice on sharing data discusses its broader benefits, rather than the practical considerations of sharing.

This paper provides practical, actionable advice on how to actually share data alongside research. The key message is sharing data falls on a continuum, and entering it should come with minimal barriers.

URL : https://arxiv.org/abs/2002.11626

Les données de la recherche AAU-CRESSON : résultats de l’enquête sur les usages des chercheurs, doctorants et ingénieurs en matière de gestion de données

Auteurs/Authors : Léa Mosnier, Françoise Acquier, Véronique Dom

Afin de mettre en place une politique de gestion des données du laboratoire AAU, une enquête a été menée au sein des deux équipes (CRENAU et CRESSON), permettant ainsi d’amorcer un plan de sensibilisation à la question des données de la recherche.

Inspirées des enquêtes effectuées auprès des chercheurs et doctorants des Universités de Lille, Rennes, Bordeaux et Bruxelles, les questionnaires ont été adaptés aux données collectées et traitées dans un laboratoire de recherche architecturale et urbaine, fortement interdisciplinaire.

URL : Les données de la recherche AAU-CRESSON : résultats de l’enquête sur les usages des chercheurs, doctorants et ingénieurs en matière de gestion de données

Original location : https://hal.archives-ouvertes.fr/hal-02462300

L’éthique des données de la recherche en sciences humaines et sociales. Une introduction

Auteurs/Authors : Bernard Jacquemin, Joachim Schöpfel, Stéphane Chaudiron, Eric Kergosien

L’organisation de l’accès libre aux données scientifiques fait partie des objectifs de la recherche publique de la France. La volonté d’ouvrir les données de la recherche a été confirmée par le plan d’action national 2018-2020 dont l’engagement 18 vise à construire un écosystème de la science ouverte.

Sur le terrain, la politique d’ouverture s’accompagne d’une forte incitation à mettre en œuvre des bonnes pratiques scientifiques compatibles avec certains principes définis au niveau européens comme « FAIR Guiding Principles » de la gestion et du pilotage des données de la recherche. Quelle est la dimension éthique d’une gestion « FAIR » des données de la recherche?

À partir d’une sélection de publications récentes, d’enquêtes, travaux et activités menées autour des données de la recherche, notre communication essaie de synthétiser plusieurs aspects de la dimension éthique de la gestion des données de la recherche, dans l’environnement français, dont la place de l’éthique dans les plans de gestion, les données personnelles, la crédibilité ou encore la sécurité des données.

URL : https://hal.archives-ouvertes.fr/GERIICO/hal-01958472v1

Faciliter et soutenir le travail des chercheurs : état des lieux, perspectives et réflexions sur l’exemple de la Haute école de travail social de Genève

Auteur/Author : Claire Wuillemin

Open science, diffusion et archivage en open access, gestion des données de recherche ; c’est cet immense mur de thématiques qui se dresse devant les chercheurs. Pour la plupart, ces enjeux sont les fruits de lentes, mais sûres transformations de la recherche vers une forme toujours plus collaborative et axée sur les données.

De plus, les chercheurs doivent faire face à une compétitivité toujours plus féroce où le nerf de la guerre réside dans la capacité à sécuriser des financements. Or, dans la continuité du foisonnement des nouveaux enjeux, les bailleurs de fonds durcissent leurs exigences d’année en année.

Pris en tenaille entre leurs responsabilités et un temps limité, les chercheurs sont souvent débordés et désarmés pour faire face à tous ces aspects. Pourtant, les chercheurs possèdent des alliés de taille autour d’eux qui peuvent les épauler sur ces divers sujets : les services institutionnels.

Synthèse d’un travail de master réalisé sur mandat de la Haute école de travail social de Genève (HETS-GE), le présent article se propose d’explorer la notion de soutien à la recherche dans un premier temps à travers la définition de ce concept et de ces enjeux, couplée à une brève revue de la littérature spécialisée.

Celle-ci est ensuite complétée par les éléments marquants d’entretiens individuels et de focus groups menés sur le terrain qui ont permis de dresser un tour d’horizon de la situation actuelle du soutien à la recherche à la HETS-GE.

La combinaison de ces deux types de données a mené à la formulation de propositions ancrées dans le contexte de la HETS-GE. Ces propositions se veulent toutefois applicables aux institutions préoccupées par les enjeux actuels de la recherche, et par les manières d’embrasser les transformations résultantes, afin de pouvoir faire évoluer l’offre de services et d’assurer un soutien adéquat et pérenne à la communauté de recherche.

URL : http://www.ressi.ch/num20/article_164

Practices, Challenges, and Prospects of Big Data Curation: a Case Study in Geoscience

Authors : Suzhen Chen, Bin Chen

Open and persistent access to past, present, and future scientific data is fundamental for transparent and reproducible data-driven research. The scientific community is now facing both challenges and opportunities caused by the growingly complex disciplinary data systems.

Concerted efforts from domain experts, information professionals, and Internet technology experts are essential to ensure the accessibility and interoperability of the big data.

Here we review current practices in building and managing big data within the context of large data infrastructure, using geoscience cyberinfrastructure such as Interdisciplinary Earth Data Alliance (IEDA) and EarthCube as a case study.

Geoscience is a data-rich discipline with a rapid expansion of sophisticated and diverse digital data sets. Having started to embrace the digital age, the community have applied big data and data mining tools into the new type of research.

We also identified current challenges, key elements, and prospects to construct a more robust and future-proof big data infrastructure for research and publication for the future, as well as the roles, qualifications, and opportunities for librarians/information professionals in the data era.

URL : Practices, Challenges, and Prospects of Big Data Curation: a Case Study in Geoscience

DOI: https://doi.org/10.2218/ijdc.v14i1.669

Formalizing Privacy Laws for License Generation and Data Repository Decision Automation

Authors : Micah Altman, Stephen Chong, Alexandra Wood

In this paper, we summarize work-in-progress on expert system support to automate some data deposit and release decisions within a data repository, and to generate custom license agreements for those data transfers.

Our approach formalizes via a logic programming language the privacy-relevant aspects of laws, regulations, and best practices, supported by legal analysis documented in legal memoranda.

This formalization enables automated reasoning about the conditions under which a repository can transfer data, through interrogation of users, and the application of formal rules to the facts obtained from users.

The proposed system takes the specific conditions for a given data release and produces a custom data use agreement that accurately captures the relevant restrictions on data use.

This enables appropriate decisions and accurate licenses, while removing the bottleneck of lawyer effort per data transfer.

The operation of the system aims to be transparent, in the sense that administrators, lawyers, institutional review boards, and other interested parties can evaluate the legal reasoning and interpretation embodied in the formalization, and the specific rationale for a decision to accept or release a particular dataset.

URL : https://arxiv.org/abs/1910.10096

Ouverture des données de la recherche : de la vision politique aux pratiques des chercheurs

Auteur/Author : Violaine Rebouillat

Cette thèse s’intéresse aux données de la recherche, dans un contexte d’incitation croissante à leur ouverture. Les données de la recherche sont des informations collectées par les scientifiques dans la perspective d’être utilisées comme preuves d’une théorie scientifique.

Il s’agit d’une notion complexe à définir, car contextuelle. Depuis les années 2000, le libre accès aux données occupe une place de plus en plus stratégique dans les politiques de recherche. Ces enjeux ont été relayés par des professions intermédiaires, qui ont développé des services dédiés, destinés à accompagner les chercheurs dans l’application des recommandations de gestion et d’ouverture.

La thèse interroge le lien entre idéologie de l’ouverture et pratiques de recherche. Quelles formes de gestion et de partage des données existent dans les communautés de recherche et par quoi sont-elles motivées ? Quelle place les chercheurs accordent-ils à l’offre de services issue des politiques de gestion et d’ouverture des données ?

Pour tenter d’y répondre, 57 entretiens ont été réalisés avec des chercheurs de l’Université de Strasbourg dans différentes disciplines. L’enquête révèle une très grande variété de pratiques de gestion et de partage de données. Un des points mis en évidence est que, dans la logique scientifique, le partage des données répond un besoin.

Il fait partie intégrante de la stratégie du chercheur, dont l’objectif est avant tout de préserver ses intérêts professionnels. Les données s’inscrivent donc dans un cycle de crédibilité, qui leur confère à la fois une valeur d’usage (pour la production de nouvelles publications) et une valeur d’échange (en tant que monnaie d’échange dans le cadre de collaborations avec des partenaires).

L’enquête montre également que les services développés dans un contexte d’ouverture des données correspondent pour une faible partie à ceux qu’utilisent les chercheurs.

L’une des hypothèses émises est que l’offre de services arrive trop tôt pour rencontrer les besoins des chercheurs. L’évaluation et la reconnaissance des activités scientifiques étant principalement fondées sur la publication d’articles et d’ouvrages, la gestion et l’ouverture des données ne sont pas considérées comme prioritaires par les chercheurs.

La seconde hypothèse avancée est que les services d’ouverture des données sont proposés par des acteurs relativement éloignés des communautés de recherche. Les chercheurs sont davantage influencés par des réseaux spécifiques à leurs champs de recherche (revues, infrastructures…).

Ces résultats invitent finalement à reconsidérer la question de la médiation dans l’ouverture des données scientifiques.

URL : https://tel.archives-ouvertes.fr/tel-02447653