L’utilisation de HAL par les laboratoires de recherche : Une étude quantitative

Auteur.ice.s/Authors : Joachim Schöpfel, Florence Thiault, Hélène Prost, Bernard Jacquemin, Éric Kergosien

L’article présente les résultats d’une étude menée dans le cadre du projet HAL/LO, sur un échantillon de 1 246 laboratoires (=1 035 612 dépôts) rattachés aux dix grandes universités de recherche et membres de l’association Udice.

L’objectif est une description plus détaillée des pratiques sur HAL. 99 % des laboratoires sont présents sur HAL, avec une distribution du type « longue traîne ». 52 % des publications sont des articles, 23 % des communications. Le degré d’ouverture moyen est 32 % (dépôts avec documents). 50 % des laboratoires ont créé une collection sur HAL.

La discussion porte sur trois aspects : le rôle des laboratoires par rapport à HAL, avec une description plus détaillée de plusieurs situations types ; l’impact des disciplines par rapport au nombre des dépôts, à la création d’une collection, au dépôt de certains types de documents ou à l’auto-archivage des documents en texte intégral ; l’évolution du dispositif HAL vers un outil pour recenser la production scientifique, ce qui pose plusieurs questions notamment sur la provenance et la qualité des métadonnées.

URL : L’utilisation de HAL par les laboratoires de recherche : Une étude quantitative

DOI : https://dx.doi.org/10.35562/balisages.1166

The Transformation of the Green Road to Open Access

Authors : Joachim Schöpfel, Stéphane Chaudiron, Bernard Jacquemin, Eric Kergosien, Hélène Prost, Florence Thiault

(1) Background: The 2002 Budapest Open Access Initiative recommended on self-archiving of scientific articles in open repositories as the “green road” to open access. Twenty years later, only one part of the researchers deposits their publications in open repositories; moreover, one part of the repositories’ content is not based on self-archived deposits but on mediated nonfaculty contributions. The purpose of the paper is to provide more empirical evidence on this situation and to assess the impact on the future of the green road.

(2) Methods: We analyzed the contributions on the French national HAL repository from more than 1,000 laboratories affiliated to the ten most important French research universities, with a focus on 2020, representing 14,023 contributor accounts and 166,939 deposits.

(3) Results: We identified seven different types of contributor accounts, including deposits from nonfaculty staff and import flows from other platforms. Mediated nonfaculty contribution accounts for at least 48% of the deposits. We also identified difference between institutions and disciplines.

(4) Conclusions: Our empirical results reveal a transformation of open repositories from self-archiving and direct scientific communication towards research information management. Repositories like HAL are somewhere in the middle of the process. The paper describes data quality as the main issue and major challenge of this transformation.

URL : The Transformation of the Green Road to Open Access

DOI : https://doi.org/10.20944/preprints202302.0268.v1

Les revues SIC et les données de recherche : Une étude empirique

Auteurs/Authors : Joachim Schöpfel, Eric Kergosien

Dans le cadre de la politique de la science ouverte, les revues scientifiques jouent un rôle central pour l’ouverture et le partage des données de recherche. Notre étude porte sur 95 revues en sciences de l’information et de la communication (liste de la section Conseil national des universités [CNU] 71).

Nous avons analysé leur politique éditoriale en matière d’intégrité et de transparence en appliquant les 10 critères du TOP Factor du Center for Open Science aux recommandations et instructions aux auteurs. Plus de la moitié des revues n’affichent aucune politique dans ce domaine.

Les autres encouragent les auteurs à partager leurs données et/ou d’autres matériels, avec parfois des consignes pour la citation des données. Très peu de revues vont plus loin et exigent une telle transparence.

Les résultats sont discutés par rapport aux divergences d’interprétation et d’évaluation, par rapport à la représentativité de l’échantillon et par rapport aux choix des rédactions et éditeurs. Plusieurs pistes pour aller plus loin sont indiquées.

URL : Les revues SIC et les données de recherche : Une étude empirique

DOI : https://dx.doi.org/10.35562/balisages.641

L’usage de la plateforme HAL par les unités de recherche de l’Université de Lille. La situation en 2021

Auteurs/Authors : Eric Kergosien, Joachim Schöpfel

Cette note présente les résultats d’une étude de suivi sur l’usage de la plateforme HAL par les laboratoires de recherche de l’Université de Lille, réalisée en avril 2021. L’analyse a porté sur les dépôts dans HAL, sur la création d’une collection et sur la part des documents en libre accès.

L’étude propose une photographie de la situation en 2021, par rapport aux résultats des analyses de 2019 et 2020, en montrant l’évolution de l’usage de HAL par les unités de recherche et l’impact de la mise en place d’une archive institutionnelle locale nommée LillOA.

URL : https://hal.archives-ouvertes.fr/hal-03372596

L’éthique des données de la recherche en sciences humaines et sociales. Une introduction

Auteurs/Authors : Bernard Jacquemin, Joachim Schöpfel, Stéphane Chaudiron, Eric Kergosien

L’organisation de l’accès libre aux données scientifiques fait partie des objectifs de la recherche publique de la France. La volonté d’ouvrir les données de la recherche a été confirmée par le plan d’action national 2018-2020 dont l’engagement 18 vise à construire un écosystème de la science ouverte.

Sur le terrain, la politique d’ouverture s’accompagne d’une forte incitation à mettre en œuvre des bonnes pratiques scientifiques compatibles avec certains principes définis au niveau européens comme « FAIR Guiding Principles » de la gestion et du pilotage des données de la recherche. Quelle est la dimension éthique d’une gestion « FAIR » des données de la recherche?

À partir d’une sélection de publications récentes, d’enquêtes, travaux et activités menées autour des données de la recherche, notre communication essaie de synthétiser plusieurs aspects de la dimension éthique de la gestion des données de la recherche, dans l’environnement français, dont la place de l’éthique dans les plans de gestion, les données personnelles, la crédibilité ou encore la sécurité des données.

URL : https://hal.archives-ouvertes.fr/GERIICO/hal-01958472v1

« Pour commencer, pourriez-vous définir ‘données de la recherche’ ? » Une tentative de réponse

Auteurs/Authors : Joachim Schöpfel, Eric Kergosien, Hélène Prost

Le projet D4Humanities s’inscrit dans le champ des Humanités numériques – comment permettre l’exploration des données de la recherche en SHS (corpus textuels ou oraux, données brutes, images…) avec des techniques numériques (text and data mining, cartographie, visualisation…) afin de construire un sens nouveau ?

Il s’inscrit dans la continuité des travaux du laboratoire GERiiCO et de ses partenaires à l’Université de Lille Sciences Humaines et Sociales (SCD, ED SHS, ANRT…) avec comme objectif d’accélérer la démarche des données de la recherche notamment par rapport aux doctorants et jeunes chercheurs, et de faciliter le montage d’un projet de recherche international.

En particulier, le projet contient trois volets : (1) Pratiques et besoins dans le domaine des données de la recherche (enquête qualitative des comportements, attitudes, motivations et besoins par rapport à la gestion et au partage des données de la recherche) ; (2) workflow pour le dépôt des données des doctorants en SHS (dépôt, préservation et diffusion des données via le service NAKALA de la TGIR Huma-Num) ; (3) recherche sur les données et les thèses (concept et typologie des données en SHS ; évolution des contenus, formats, structures et prescriptions des thèses dans l’environnement de l’Open Science).

Le projet sera mené avec l’ISN Oldenburg et d’autres partenaires étrangers ; il facilitera la création d’un consortium et le montage d’un projet de recherche dans les Humanités numériques sur les thèses de doctorat de l’avenir, avec un financement européen (H2020) ou franco-allemand (ANR/DFG).

Cette communication présente les grandes lignes de l’étude sur les données de l’axe 3, c’est-à-dire l’analyse du concept de données de la recherche, pour mieux cerner l’identification (granularité), pour mieux comprendre la distinction et les relations entre données primaires et secondaires et pour affiner la catégorisation des données en SHS. L’accent est mis sur une triple approche, conceptuelle, typologique et fonctionnelle.

URL : http://hal.univ-lille3.fr/hal-01530937