Auteur/Author : Gérald Kembellec
La réponse à des problématiques scientifiques liées aux humanités passe par le traitement numérique de corpus. Les humanités numériques deviennent un sujet d’importance qui regroupe des savoirs et des méthodes issus de diverses disciplines comme l’informatique, les statistiques, la sociologie, la cartographie ou encore la linguistique.
Cet article, s’il est ancré dans les sciences de l’information et de la communication, convoque des méthodes périphériques et se propose comme un vade-mecum de la gestion des données des humanités : la qualification, la collecte, le traitement, l’enrichissement, la documentation et le partage des données des humanités.
Nous mettons ici en avant le concept de « courtoisie du FAIR data » en contexte scientifique : la valorisation des corpus, en particulier par le partage de jeux de données de qualité, documentés et accessibles physiquement et légalement exploitables. Nous insistons également sur l’éthique lors des étapes de traitement et d’exploitation des données de la recherche.
URL : https://halshs.archives-ouvertes.fr/ISKOFRANCE2019/hal-02306958