Wikiometrics: A Wikipedia Based Ranking System

We present a new concept – Wikiometrics – the derivation of metrics and indicators from Wikipedia. Wikipedia provides an accurate representation of the real world due to its size, structure, editing policy and popularity. We demonstrate an innovative mining methodology, where different elements of Wikipedia – content, structure, editorial actions and reader reviews – are used to rank items in a manner which is by no means inferior to rankings produced by experts or other methods. We test our proposed method by applying it to two real-world ranking problems: top world universities and academic journals. Our proposed ranking methods were compared to leading and widely accepted benchmarks, and were found to be extremely correlative but with the advantage of the data being publically available.

URL : http://arxiv.org/abs/1601.01058

Les revues littéraires en ligne : entre éditorialisation et réseaux d’intelligences

Cet article propose un état des lieux sur les revues littéraires numériques. Cette tâche pourrait sembler facile si l’on considère que ces expériences existent depuis très peu de temps. Les premières revues en ligne apparaissent, en effet, au début des années 1990.

Pourtant, la question est beaucoup plus complexe que ce que l’on pourrait penser, et cela, pour une série de raisons qui seront analysées dans cet article. Il n’est tout d’abord pas évident de s’entendre sur ce que l’on définit par l’expression « revue littéraire numérique ».

D’une part car on fait référence, avec le mot « numérique », à une série d’expériences et de pratiques hétérogènes et différentes qui peuvent difficilement être regroupées ensemble. D’autre part parce que ce qu’on appelle désormais la « révolution numérique » a déterminé des changements importants quant au sens des contenus, de leur production, de leur validation et de leur distribution et a par conséquent fortement affecté la signification du mot « revue » lui-même.

Il faudra ainsi prendre séparément en considération une série de phénomènes différents et essayer de rendre compte de pratiques hétérogènes qui se chevauchent et empiètent l’une sur l’autre. L’article proposera d’abord une analyse des enjeux de la numérisation des revues, à savoir le processus de transposition des revues papier au format électronique.

Il s’attaquera ensuite aux expériences des revues numériques dès leur création pour comprendre s’il y a une différence, et laquelle, entre les premières et les secondes.

Pour finir, on tentera de comprendre en quoi le numérique en tant que phénomène culturel — et en particulier les changements de diffusion et de circulation des contenus ainsi que les différentes formes de ce que l’on appelle désormais « éditorialisation » — a transformé l’idée même de revue et donné lieu à des pratiques et à des expériences complexes et hybrides dont la place dans le panorama culturel est difficile à saisir.

URL : https://papyrus.bib.umontreal.ca/xmlui/bitstream/handle/1866/11379/revues-litteraires-en-ligne-vitali-rosati.pdf

Leading by Example? ALA Division Publications, Open Access, and Sustainability

This investigation explores scholarly communication business models in American Library Association (ALA) division peer-reviewed academic journals. Previous studies reveal the numerous issues organizations and publishers face in the academic publishing environment. Through an analysis of documented procedures, policies, and finances of five ALA division journals, we compare business and access models.

We conclude that some ALA divisions prioritize the costs associated with changing business models, including hard-to-estimate costs such as the labor of volunteers. For other divisions, the financial aspects are less important than maintaining core values, such as those defined in ALA’s Core Values in Librarianship.

URL : http://m.crl.acrl.org/content/early/2015/12/14/crl15-841.abstract

Quand la culture scientifique s’affranchit sur le web : l’exemple des blogs de science en français (2003-2014)

Connaissez-vous les chercheurs Baptiste Coulmont, Jean Véronis , Tom Roud (un pseudonyme), Olivier Ertzscheid ou André Gunthert ? Peut-être, mais ils vous diront sans doute plus de choses si vous êtes un lecteur aguerri des blogs de science, éventuellement de longue date. Ces pionniers des blogs de science en français, ayant chacun ouvert leur blog entre juillet 2003 et août 2005, ont contribué entre à ce que l’association des termes “blog” et “chercheur” ne soit plus incongrue. Quant à moi, si je tenais déjà un blog personnel, je n’ai ouvert mon propre blog de science qu’en janvier 2006.

J’ai par la suite contribué largement à façonner cette communauté alors en éclosion, grâce au portail du C@fé des sciences et à mon prosélytisme à tout crin. À la fois acteur et témoin privilégié de cette histoire, j’aimerais vous en conter quelques bribes, en priant les lecteurs de m’excuser des maladresses que je pourrai commettre dans cet exercice délicat et nouveau pour moi. Mon propos sera organisé de façon thématique, en suivant à peu près une progression chronologique.

Je ferai le plus souvent appel à ma mémoire et mes archives personnelles, tout en citant des documents tiers contemporains du récit qui compléteront mon témoignage et donneront un aperçu de l’évolution du discours et des arguments !

URL : https://halshs.archives-ouvertes.fr/halshs-01242707

Why scientific publications should be anonymous

Numerous studies have revealed biases within the scientific communication system and across all scientific fields. For example, already prominent researchers receive disproportional credit compared to their (almost) equally qualified colleagues — because of their prominence. However, none of those studies has offered a solution as to how to decrease the incidence of these biases. In this paper I argue that by publishing anonymously, we can decrease the incidence of inaccurate heuristics in the current scientific communication system. Specific suggestions are made as to how to implement the changes.

URL : http://arxiv.org/abs/1512.05382

Semantic representation of scientific literature: bringing claims, contributions and named entities onto the Linked Open Data cloud

Motivation

Finding relevant scientific literature is one of the essential tasks researchers are facing on a daily basis. Digital libraries and web information retrieval techniques provide rapid access to a vast amount of scientific literature. However, no further automated support is available that would enable fine-grained access to the knowledge ‘stored’ in these documents. The emerging domain of Semantic Publishing aims at making scientific knowledge accessible to both humans and machines, by adding semantic annotations to content, such as a publication’s contributions, methods, or application domains.

However, despite the promises of better knowledge access, the manual annotation of existing research literature is prohibitively expensive for wide-spread adoption. We argue that a novel combination of three distinct methods can significantly advance this vision in a fully-automated way: (i) Natural Language Processing (NLP) for Rhetorical Entity (RE) detection; (ii) Named Entity (NE) recognition based on the Linked Open Data (LOD) cloud; and (iii) automatic knowledge base construction for both NEs and REs using semantic web ontologies that interconnect entities in documents with the machine-readable LOD cloud.

Results

We present a complete workflow to transform scientific literature into a semantic knowledge base, based on the W3C standards RDF and RDFS. A text mining pipeline, implemented based on the GATE framework, automatically extracts rhetorical entities of type Claims and Contributions from full-text scientific literature. These REs are further enriched with named entities, represented as URIs to the linked open data cloud, by integrating the DBpedia Spotlight tool into our workflow.

Text mining results are stored in a knowledge base through a flexible export process that provides for a dynamic mapping of semantic annotations to LOD vocabularies through rules stored in the knowledge base. We created a gold standard corpus from computer science conference proceedings and journal articles, where Claim and Contribution sentences are manually annotated with their respective types using LOD URIs. The performance of the RE detection phase is evaluated against this corpus, where it achieves an average F-measure of 0.73. We further demonstrate a number of semantic queries that show how the generated knowledge base can provide support for numerous use cases in managing scientific literature.

URL : Semantic representation of scientific literature: bringing claims, contributions and named entities onto the Linked Open Data cloud

Alternative location : https://doi.org/10.7717/peerj-cs.37

Science bloggers’ self-perceived communication roles

This study addresses an open question about science bloggers’ self-perceived roles as science communicators. Previous research has investigated the roles science journalists see themselves engaging in, but such research has failed to capture the experiences of science bloggers as a broad and diverse group that is yet often very different in their practices from professional journalists.

In this study, a survey of over 600 science bloggers reveals that on the broadest level, science bloggers see themselves engaging most often as explainers of science and public intellectuals. Perceived communication role depends predominantly on occupation, science communication training, blog affiliation and gender.

URL : Science bloggers’ self-perceived communication roles

Alternative location : http://jcom.sissa.it/archive/14/04/JCOM_1404_2015_A02