Annotation sémantique pour une interrogation experte des Bulletins de Santé du Végétal

Auteurs/Authors : Catherine Roussey, Tayeb Ghorfi

Le corpus des Bulletins de Santé du Végétal est actuellement disponible sur le Web de données. Les annotations associées à chaque bulletin sont organisées par des propriétés issues du vocabulaire du Dublin Core. Ces annotations répondent à un besoin de recherche documentaire basé sur trois composants : régions françaises, période de publication et types de cultures.

Nous avons appliqué une des méthodes de construction d’ontologies de Neon pour faire évoluer le modèle d’annotation des bulletins. Ce modèle contient une ontologie des observations des parcelles et un modèle d’annotation liant le contenu textuel à une entité définie dans l’ontologie précédente. Ces nouveaux modèles répondent à des besoins d’information exprimés par les agronomes.

URL : https://hal.archives-ouvertes.fr/hal-01839545

Réflexions sur le fragment dans les pratiques scientifiques en ligne : entre matérialité documentaire et péricope

Auteurs/Authors : Gérald Kembellec, Thomas Bottini

Cette communication propose une réflexion pluridisciplinaire (SIC, ingénierie documentaire et théorie du document numérique, informatique, « humanités numériques », histoire des pratiques savantes) sur les usages du fragment dans les pratiques documentaires scientifiques en ligne.

En prolongement de ces éléments théoriques sont proposés un modèle théorique de la segmentation des contenus en unités de sens (péricope) et des directions d’implémentation.

URL : https://hal-univ-paris10.archives-ouvertes.fr/hal-01700064

Biotea: semantics for Pubmed Central

Authors : Alexander Garcia​, Federico Lopez, Leyla Garcia, Olga Giraldo, Victor Bucheli, Michel Dumontier

A significant portion of biomedical literature is represented in a manner that makes it difficult for consumers to find or aggregate content through a computational query. One approach to facilitate reuse of the scientific literature is to structure this information as linked data using standardized web technologies.

In this paper we present the second version of Biotea, a semantic, linked data version of the open-access subset of PubMed Central that has been enhanced with specialized annotation pipelines that uses existing infrastructure from the National Center for Biomedical Ontology.

We expose our models, services, software and datasets. Our infrastructure enables manual and semi-automatic annotation, resulting data are represented as RDF-based linked data and can be readily queried using the SPARQL query language.

We illustrate the utility of our system with several use cases. Our datasets, methods and techniques are available at http://biotea.github.io.

URL : Biotea: semantics for Pubmed Central

DOI : https://doi.org/10.7717/peerj.4201

Semantic representation and enrichment of information retrieval experimental data

Authors : Gianmaria Silvello, Georgeta Bordea, Nicola Ferro, Paul Buitelaar, Toine Bogers

Experimental evaluation carried out in international large-scale campaigns is a fundamental pillar of the scientific and technological advancement of information retrieval (IR) systems.

Such evaluation activities produce a large quantity of scientific and experimental data, which are the foundation for all the subsequent scientific production and development of new systems.

In this work, we discuss how to semantically annotate and interlink this data, with the goal of enhancing their interpretation, sharing, and reuse. We discuss the underlying evaluation workflow and propose a resource description framework model for those workflow parts.

We use expertise retrieval as a case study to demonstrate the benefits of our semantic representation approach. We employ this model as a means for exposing experimental data as linked open data (LOD) on the Web and as a basis for enriching and automatically connecting this data with expertise topics and expert profiles.

In this context, a topic-centric approach for expert search is proposed, addressing the extraction of expertise topics, their semantic grounding with the LOD cloud, and their connection to IR experimental data.

Several methods for expert profiling and expert finding are analysed and evaluated. Our results show that it is possible to construct expert profiles starting from automatically extracted expertise topics and that topic-centric approaches outperform state-of-the-art language modelling approaches for expert finding.

URL : https://aran.library.nuigalway.ie/handle/10379/5862