Usages et applications du web sémantique en bibliothèques numériques

Author : Hiba Melhem

Ce travail de recherche se situe dans le champ interdisciplinaire des sciences de l’information et de la communication (SIC) et a pour but d’explorer la question de l’usage du web sémantique en bibliothèques numériques.

Le web oblige les bibliothèques à repenser leurs organisations, leurs activités, leurs pratiques et leurs services, afin de se repositionner en tant qu’instituts de références pour la diffusion des savoirs. Dans cette thèse, nous souhaitons comprendre les contextes d’usage du web sémantique en bibliothèques numériques françaises.

Il s’agit de s’interroger sur les apports du web sémantique au sein de ces bibliothèques, ainsi que sur les défis et les obstacles qui accompagnent sa mise en place. Ensuite, nous nous intéressons aux pratiques documentaires et à leurs évolutions suite à l’introduction du web sémantique en bibliothèques numériques.

La problématique s’attache au rôle que peuvent jouer les professionnels de l’information dans la mise en place du web sémantique en bibliothèques numériques. Après avoir sélectionné 98 bibliothèques numériques suite à une analyse de trois recensements, une enquête s’appuyant sur un questionnaire vise à recueillir des données sur l’usage du web sémantique dans ces bibliothèques.

Ensuite, une deuxième enquête réalisée au moyen d’entretiens permet de mettre en évidence les représentations qu’ont les professionnels de l’information du web sémantique et de son usage en bibliothèque, ainsi que de l’évolution de leurs pratiques professionnelles.

Les résultats montrent que la représentation des connaissances dans le cadre du web sémantique nécessite une intervention humaine permettant de fournir le cadre conceptuel pour déterminer les liens entre les données.

Enfin, les professionnels de l’information peuvent devenir des acteurs du web sémantique, dans le sens où leurs rôles ne se limitent pas à l’utilisation du web sémantique mais aussi au développement de ses standards pour assurer une meilleure organisation des connaissances.

URL : https://tel.archives-ouvertes.fr/tel-01742957

Réflexions sur le fragment dans les pratiques scientifiques en ligne : entre matérialité documentaire et péricope

Auteurs/Authors : Gérald Kembellec, Thomas Bottini

Cette communication propose une réflexion pluridisciplinaire (SIC, ingénierie documentaire et théorie du document numérique, informatique, « humanités numériques », histoire des pratiques savantes) sur les usages du fragment dans les pratiques documentaires scientifiques en ligne.

En prolongement de ces éléments théoriques sont proposés un modèle théorique de la segmentation des contenus en unités de sens (péricope) et des directions d’implémentation.

URL : https://hal-univ-paris10.archives-ouvertes.fr/hal-01700064

Research Articles in Simplified HTML: a Web-first format for HTML-based scholarly articles

Authors : Silvio Peroni, Francesco Osborne, Angelo Di Iorio, Andrea Giovanni Nuzzolese, Francesco Poggi, Fabio Vitali, Enrico Motta

Purpose

This paper introduces the Research Articles in Simplified HTML (or RASH), which is a Web-first format for writing HTML-based scholarly papers; it is accompanied by the RASH Framework, i.e. a set tools for interacting with RASH-based articles. The paper also presents an evaluation that involved authors and reviewers of RASH articles, submitted to the SAVE-SD 2015 and SAVE-SD 2016 workshops.

Design

RASH has been developed in order to: be easy to learn and use; share scholarly documents (and embedded semantic annotations) through the Web; support its adoption within the existing publishing workflow.

Findings

The evaluation study confirmed that RASH can already be adopted in workshops, conferences and journals and can be quickly learnt by researchers who are familiar with HTML.

Research limitations

The evaluation study also highlighted some issues in the adoption of RASH, and in general of HTML formats, especially by less technical savvy users. Moreover, additional tools are needed, e.g. for enabling additional conversion from/to existing formats such as OpenXML.

Practical implications

RASH (and its Framework) is another step towards enabling the definition of formal representations of the meaning of the content of an article, facilitate its automatic discovery, enable its linking to semantically related articles, provide access to data within the article in actionable form, and allow integration of data between papers.

Social implications

RASH addresses the intrinsic needs related to the various users of a scholarly article: researchers (focussing on its content), readers (experiencing new ways for browsing it), citizen scientists (reusing available data formally defined within it through semantic annotations), publishers (using the advantages of new technologies as envisioned by the Semantic Publishing movement).

Value

RASH focuses strictly on writing the content of the paper (i.e., organisation of text + semantic annotations) and leaves all the issues about it validation, visualisation, conversion, and semantic data extraction to the various tools developed within its Framework.

URL : https://essepuntato.github.io/papers/rash-peerj2016.html

Decentralized provenance-aware publishing with nanopublications

Authors : Tobias Kuhn, Christine Chichester, Michael Krauthammer, Núria Queralt-Rosinach, Ruben Verborgh, George Giannakopoulos, Axel-Cyrille Ngonga Ngomo, Raffaele Viglianti, Michel Dumontier

Publication and archival of scientific results is still commonly considered the responsability of classical publishing companies. Classical forms of publishing, however, which center around printed narrative articles, no longer seem well-suited in the digital age.

In particular, there exist currently no efficient, reliable, and agreed-upon methods for publishing scientific datasets, which have become increasingly important for science. In this article, we propose to design scientific data publishing as a web-based bottom-up process, without top-down control of central authorities such as publishing companies.

Based on a novel combination of existing concepts and technologies, we present a server network to decentrally store and archive data in the form of nanopublications, an RDF-based format to represent scientific data.

We show how this approach allows researchers to publish, retrieve, verify, and recombine datasets of nanopublications in a reliable and trustworthy manner, and we argue that this architecture could be used as a low-level data publication layer to serve the Semantic Web in general.

Our evaluation of the current network shows that this system is efficient and reliable.

URL : Decentralized provenance-aware publishing with nanopublications

DOI : https://doi.org/10.7717/peerj-cs.78

Le catalogue des bibliothèques et ses données à l’heure du web

Auteur/Author : Raphaëlle Lapôtre

Le point de vue de cet article est de décrire la logique du web et du web de données à la lumière des enseignements de Michel Foucault, tels qu’on peut les lire, notamment, dans Les Mots et les Choses (1966).

Dans un premier temps, les données sur le web jouent le rôle que jouait au XVIIe siècle la monnaie : à la fois représentation des richesses, substitution dans le cadre d’échange différés et mesure de la valeur, en l’occurrence, de l’attention que leur attribuent les acteurs du web.

Du point de vue de la gestion de l’attention, deux visions économiques s’affrontent sur le web : l’une, plutôt utilitariste, s’attache à définir la valeur du point de vue de la subjectivité humaine et du besoin, l’autre, plutôt physiocrate, cherche à transformer l’abondance d’information pour la découper et la synthétiser.

Le Web de données quant à lui, reflète ces deux logiques au sein même du langage qui sert à l’exprimer : le RDF reproduit à sa manière l’attribution qui est le principe du lien hypertexte, tandis que les ontologies donnent à lire une classification du monde et des données qui le représentent.

D’une certaine manière, la logique épistémologique des données massives bouleversent quelque peu la logique représentationnelle du web, leur principe fondamental n’étant plus l’analyse ou la critique, mais bien la recherche de corrélation, la mise en parallèle, le commentaire.

URL : https://halshs.archives-ouvertes.fr/halshs-01331753v1

Using the Semantic Web for Rapid Integration of WikiPathways with Other Biological Online Data Resources

Authors : Andra Waagmeester,  Martina Kutmon, Anders Riutta, Ryan Miller,  Egon L. Willighagen, Chris T.  Evelo , Alexander R. Pico

The diversity of online resources storing biological data in different formats provides a challenge for bioinformaticians to integrate and analyse their biological data.

The semantic web provides a standard to facilitate knowledge integration using statements built as triples describing a relation between two objects. WikiPathways, an online collaborative pathway resource, is now available in the semantic web through a SPARQL endpoint at http://sparql.wikipathways.org.

Having biological pathways in the semantic web allows rapid integration with data from other resources that contain information about elements present in pathways using SPARQL queries.

In order to convert WikiPathways content into meaningful triples we developed two new vocabularies that capture the graphical representation and the pathway logic, respectively. Each gene, protein, and metabolite in a given pathway is defined with a standard set of identifiers to support linking to several other biological resources in the semantic web.

WikiPathways triples were loaded into the Open PHACTS discovery platform and are available through its Web API (https://dev.openphacts.org/docs) to be used in various tools for drug development.

We combined various semantic web resources with the newly converted WikiPathways content using a variety of SPARQL query types and third-party resources, such as the Open PHACTS API. The ability to use pathway information to form new links across diverse biological data highlights the utility of integrating WikiPathways in the semantic web.

URL : Using the Semantic Web for Rapid Integration of WikiPathways with Other Biological Online Data Resources

DOI : http://dx.doi.org/10.1371/journal.pcbi.1004989

Linking Libraries to the Web: Linked Data and the Future of the Bibliographic Record

Statut

“The ideas behind Linked Data and the Semantic Web have recently gained ground and shown the potential to redefine the world of the web. Linked Data could conceivably create a huge database out of the Internet linked by relationships understandable by both humans and machines. The benefits of Linked Data to libraries and their users are potentially great, but so are the many challenges to its implementation. The BIBFRAME Initiative provides the possible framework that will link library resources with the web, bringing them out of their information silos and making them accessible to all users.”

URL : https://microblogging.infodocs.eu/wp-content/uploads/2015/02/gonzales2014.pdf

DOI : 10.6017/ital.v33i4.5631