Semantic representation and enrichment of information retrieval experimental data

Authors : Gianmaria Silvello, Georgeta Bordea, Nicola Ferro, Paul Buitelaar, Toine Bogers

Experimental evaluation carried out in international large-scale campaigns is a fundamental pillar of the scientific and technological advancement of information retrieval (IR) systems.

Such evaluation activities produce a large quantity of scientific and experimental data, which are the foundation for all the subsequent scientific production and development of new systems.

In this work, we discuss how to semantically annotate and interlink this data, with the goal of enhancing their interpretation, sharing, and reuse. We discuss the underlying evaluation workflow and propose a resource description framework model for those workflow parts.

We use expertise retrieval as a case study to demonstrate the benefits of our semantic representation approach. We employ this model as a means for exposing experimental data as linked open data (LOD) on the Web and as a basis for enriching and automatically connecting this data with expertise topics and expert profiles.

In this context, a topic-centric approach for expert search is proposed, addressing the extraction of expertise topics, their semantic grounding with the LOD cloud, and their connection to IR experimental data.

Several methods for expert profiling and expert finding are analysed and evaluated. Our results show that it is possible to construct expert profiles starting from automatically extracted expertise topics and that topic-centric approaches outperform state-of-the-art language modelling approaches for expert finding.

URL : https://aran.library.nuigalway.ie/handle/10379/5862

Linked Data is People: Building a Knowledge Graph to Reshape the Library Staff Directory

Authors : Jason A. Clark, Scott W. H. Young

One of our greatest library resources is people. Most libraries have staff directory information published on the web, yet most of this data is trapped in local silos, PDFs, or unstructured HTML markup.

With this in mind, the library informatics team at Montana State University (MSU) Library set a goal of remaking our people pages by connecting the local staff database to the Linked Open Data (LOD) cloud.

In pursuing linked data integration for library staff profiles, we have realized two primary use cases: improving the search engine optimization (SEO) for people pages and creating network graph visualizations.

In this article, we will focus on the code to build this library graph model as well as the linked data workflows and ontology expressions developed to support it. Existing linked data work has largely centered around machine-actionable data and improvements for bots or intelligent software agents.

Our work demonstrates that connecting your staff directory to the LOD cloud can reveal relationships among people in dynamic ways, thereby raising staff visibility and bringing an increased level of understanding and collaboration potential for one of our primary assets: the people that make the library happen.

URL : http://journal.code4lib.org/articles/12320

Contours du document numérique connecté

Auteur/Author : Evelyne Broudoux

Cette introduction à Cide s’attache à cerner une tendance de l’évolution du document numérique depuis sa théorisation interdisciplinaire par l’auteur collectif Pédauque en 2006, en un triangle constitué par la forme, le signe, la médiation.

La première observation est que les limites internes et externes au document numérique se sont modifiées depuis une dizaine d’années.

Trois types de documents en apportent la preuve : le document publié, connecté sur la toile ; le document-processus, support d’une collaboration ; le document support d’écrilecture.

Au document connecté sont associés des collections virtuelles que les moteurs de recommandations sont capables de constituer et diverses modalités d’annotations. Dans le document processus d’une collaboration, ce sont les éléments internes au document-container qui vont constituer des instances actualisables du document.

Le document support d’écrilecture est un document qui s’inscrit dans la tradition de la lecture-commentaire héritée des pratiques érudites d’exégèse des textes. Si l’annotation sémantique est un procédé qui vise à indexer une portion de texte à un thésaurus externe et à le relier à de futurs contextes de lecture, la commentarisation vise à procurer un feedback immédiat à l’auteur investi dans un travail d’écriture ou de publication.

L’examen de l’évolution de l’outillage de lecture d’articles scientifiques en ligne, des outils d’annotation et de commentarisation prouve qu’ils s’inscrivent dans la sémantisation du web. Nous ferons le constat qu’il existe une convergence entre l’approche structurelle et l’approche communicationnelle de Pédauque dans les projets d’humanités numériques.

URL : http://archivesic.ccsd.cnrs.fr/sic_01327851

Le virage Linked Open Data en bibliothèque : étude des pratiques, mise en œuvre, compétences des professionnels

Les Linked Open Data (LOD) mettent peu à peu en évidence des enjeux considérables pour les professionnels de l’information et les bibliothèques. Cet article fait un tour d’horizon de la question en abordant plusieurs aspects. Après avoir introduit les concepts-clés de cette thématique, il s’attache à déterminer l’utilité des LOD en bibliothèque en présentant quelques applications innovantes. Prérequis pour la création de telles applications, la conversion des données en LOD est décrite sous la forme d’un procédé généralisable.

L’article change ensuite de perspective et se penche sur le professionnel de l’information, en identifiant les compétences les plus pertinentes à acquérir pour faire face à ces évolutions. Enfin, il décrit la réalisation concrète d’une formation à distance sur les LOD, accessible à tous sur le web.

URL : http://www.ressi.ch/num15/article_100