Research Data Reusability: Conceptual Foundations, Barriers and Enabling Technologies

Author : Costantino Thanos

High-throughput scientific instruments are generating massive amounts of data. Today, one of the main challenges faced by researchers is to make the best use of the world’s growing wealth of data. Data (re)usability is becoming a distinct characteristic of modern scientific practice.

By data (re)usability, we mean the ease of using data for legitimate scientific research by one or more communities of research (consumer communities) that is produced by other communities of research (producer communities).

Data (re)usability allows the reanalysis of evidence, reproduction and verification of results, minimizing duplication of effort, and building on the work of others. It has four main dimensions: policy, legal, economic and technological. The paper addresses the technological dimension of data reusability.

The conceptual foundations of data reuse as well as the barriers that hamper data reuse are presented and discussed. The data publication process is proposed as a bridge between the data author and user and the relevant technologies enabling this process are presented.

URL : Research Data Reusability: Conceptual Foundations, Barriers and Enabling Technologies

DOI : http://dx.doi.org/10.3390/publications5010002

Open access articles receive more citations in hybrid marine ecology journals

Author : Jeff C. Clements

The accumulation of evidence that open access publishing can increase citation rates highlights one benefit of universal accessibility to scholarly works. However, studies investigating the effect of open access publishing on citations are typically conducted across a wide variety of journals and disciplines, introducing a number of potential issues and limiting their utility for specific disciplines.

Here, I used three primary marine ecology journals with an open access option as a “microcosm” of scientific publishing to determine whether or not open access articles received more citations than non-open access articles during the same time frame, controlling for self-citations, article type, and journal impact factor.

I also tested for the effects of time since publication and the number of authors. Citations were positively correlated with time since publication and differed across the three journals. In addition, open access articles received significantly more citations than non-open access articles.

Self-citations increased with author number and were affected by a complex interaction between open access, journal, and time since publication. This study demonstrates that open access articles receive more citations in hybrid marine ecology journals, although the causal factors driving this trend are unknown.

URL : Open access articles receive more citations in hybrid marine ecology journals

DOI : http://dx.doi.org/10.1139/facets-2016-0032

Elsevier: Among the World’s Largest Open Access Publishers as of 2016

Author : Heather Morrison

Highlights of this broad-brush case study of Elsevier’s Open Access (OA) journals as of 2016: Elsevier offers 511 fully OA journals and 2,149 hybrids. Most fully OA journals do not charge article processing charges (APCs). APCs of fully OA journals average $660 US ($1,731 excluding no-fee journals); hybrid OA averages $2,500.

A practice termed author nominal copyright is observed, where copyright is in the name of the author although the author contract is essentially a copyright transfer. The prospects for a full Elsevier flip to OA via APC payments for articles going forward are considered and found to be problematic.

DOI : https://doi.org/10.5260/chara.18.3.53

La place des données publiques dans la communication territoriale : le cas des données liées aux transports et déplacements dans la métropole de Grenoble

Auteur/Author : Mouhameth Beye

L’objectif de ce mémoire est d’analyser l’historicité de l’ouverture des données publiques au niveau local précisément à la métropole de Grenoble. Il propose l’analyse de deux corpus relatifs à la mise à disposition de l’information publique locale : le magazine de la métropole de Grenoble de 1996 à 2015 et le portail « open data » de ladite métropole.

Ce présent travail se donnera pour mission de s’interroger sur la temporalité de cette pratique d’ouverture des données publiques matérialisées aujourd’hui par les portails du même nom.

Nous faisons l’hypothèse que l’ouverture des données publiques, au niveau local, constituerait un renouvellement de l’information service, pratique déjà existante historiquement dans les supports de communication des collectivités territoriales et que les transformations qu’elle apporte ne sont pas à la hauteur des discours qui l’accompagnent, faisant de lui une « révolution » dans la manière de gérer l’information publique locale.

Ce travail s’inscrit totalement dans les sciences de l’information et de la communication (SIC) dans la mesure où il questionne l’information publique, partie intégrante de la communication publique.

URL : https://dumas.ccsd.cnrs.fr/dumas-01373242

Les pratiques informationnelles des chercheurs à l’ère du numérique

Auteur/Author : Amal Jaouzi

Dans la présente étude, nous avons tenté d’analyser les modalités d’accès aux informations scientifiques et techniques, en particulier et aux publications scientifiques éditées par les grands éditeurs, en général.

Nous précisons que ladite analyse porte principalement sur les pratiques informationnelles des chercheurs issus des pays en voie de développement, notamment les enseignants-chercheurs et les doctorants marocains.

En effet, notre étude s’inscrit dans le domaine des Sciences de l’Information et de la Communication dans la mesure où elle traite principalement les problématiques d’accès aux communications scientifiques.

Á ce titre, en vue d’apporter des éléments de réponse et d’explication aux questions de recherche que nous avons défini au début de cette étude, nous nous sommes entretenus avec vingt-et-un (21) chercheurs marocains issus de trois instituts d’enseignement supérieur : IAV, INPT et ESI, dont le domaine est respectivement, l’agronomie et la médecine vétérinaire ; les télécommunications et les sciences de l’information.

Il s’agit d’un entretien semi-directif guidé par une grille d’entretien. Par ailleurs, selon les résultats de l’enquête menée, l’accès aux informations scientifiques est problématique au Maroc.

Les chercheurs font appel à des pratiques contournées pour acquérir les articles scientifiques, notamment, l’utilisation de certains réseaux de partage tel que ResearchGate ou l’utilisation des sites de recensement des productions scientifiques de grands éditeurs, comme la plate-forme Sci-Hub ou Libgen.

Outre ces constats, nous avons tenté, par le biais de ce travail, de situer l’usage du hashtag #IcanhazPDF dans la démarche d’accès aux communications scientifiques. Par conséquent, nous avons constaté que ladite pratique demeure récente et méconnue dans le contexte marocain mais, à laquelle les chercheurs marocains ont porté un intérêt particulier et ont exprimé leurs volontés de l’utiliser et de la pratiquer.

La valeur ajoutée de ce travail est transversale dans le sens où il présente une analyse axée sur l’usage des productions scientifiques dans deux contextes différents : marocain et étranger -en particulier français- et dans le sens où il présente également l’étude d’une pratique nouvelle qui n’a pas été traitée par un grand nombre de chercheurs.

Nous évoquons, à ce niveau, la pratique de demande des articles scientifiques payants moyennant le hashtag #IcanhazPDF sur le réseau social Twitter.

URL : https://dumas.ccsd.cnrs.fr/dumas-01379402

Améliorer l’exposition des données de la recherche : la publication de data papers

Auteur/Author : Nathalie Reymonet

Les données de la recherche sont l’objet de l’intérêt des financeurs de la recherche publique, qui incitent les chercheurs à partager ces données, afin de répondre à des enjeux financiers comme de circulation des savoirs.

Parmi les différentes modalités de la communication scientifique, la publication d’un « data paper » est une démarche relativement nouvelle. Le « data paper », ou article sur des données, décrit des données scientifiques et propose un lien vers un entrepôt de données qui les stocke.

La description est en particulier très précise sur les points techniques et la méthodologie de production des données. Cette démarche va dans le sens de l’exposition des données, de leur accessibilité, leur interopérabilité et leur réutilisabilité, répondant ainsi aux recommandations des communautés d’intérêt de la recherche académique.

Ce texte présente la structure et le contenu d’un « data paper » ainsi que des exemples de revues qui publient de tels articles.

URL : Améliorer l’exposition des données de la recherche : la publication de data papers

Alternative location : https://archivesic.ccsd.cnrs.fr/sic_01427978

Decentralized provenance-aware publishing with nanopublications

Authors : Tobias Kuhn, Christine Chichester, Michael Krauthammer, Núria Queralt-Rosinach, Ruben Verborgh, George Giannakopoulos, Axel-Cyrille Ngonga Ngomo, Raffaele Viglianti, Michel Dumontier

Publication and archival of scientific results is still commonly considered the responsability of classical publishing companies. Classical forms of publishing, however, which center around printed narrative articles, no longer seem well-suited in the digital age.

In particular, there exist currently no efficient, reliable, and agreed-upon methods for publishing scientific datasets, which have become increasingly important for science. In this article, we propose to design scientific data publishing as a web-based bottom-up process, without top-down control of central authorities such as publishing companies.

Based on a novel combination of existing concepts and technologies, we present a server network to decentrally store and archive data in the form of nanopublications, an RDF-based format to represent scientific data.

We show how this approach allows researchers to publish, retrieve, verify, and recombine datasets of nanopublications in a reliable and trustworthy manner, and we argue that this architecture could be used as a low-level data publication layer to serve the Semantic Web in general.

Our evaluation of the current network shows that this system is efficient and reliable.

URL : Decentralized provenance-aware publishing with nanopublications

DOI : https://doi.org/10.7717/peerj-cs.78