Comment mieux tirer parti des journaux historiques

09-201708-2020

impresso – Media monitoring the past

Les journaux historiques constituent un fonds essentiel pour la recherche scientifique, la digitalisation facilitant l’accès à ces sources. Néanmoins, des logiciels de reconnaissance de texte imparfaits, des métadonnées manquantes ou des fonctions de recherche difficiles à utiliser restreignent leur utilisation en pratique. Ce sont ces défis que relève le projet de recherche impresso.

1 / 4

impresso: Media monitoring of the past. Mining 200 years of historical newspapers est un projet commun du C²DH, du Digital Humanities Laboratory de l’École polytechnique fédérale de Lausanne (EPFL) et de l’Institut de linguistique informatique de l’Université de Zurich. Financé par le Fonds national suisse de la recherche scientifique (FNS), le projet trisannuel a été lancé en septembre 2017.

Plus concrètement, il s’agit de développer de nouvelles méthodes d’évaluation en se basant sur un corpus numérisé de journaux et revues périodiques suisses, luxembourgeois, français, belges et allemands couvrant une période de près de 200 ans. L’optimisation dans la reconnaissance de texte, une meilleure identification des entités (noms de personnes, institutions, lieux) et l’enrichissement de ces noms propres à l’aide de référentiels de données externes en font partie. De plus, le traitement par la linguistique informatique promet de structurer les textes numérisés, pour une « lecture distante » et une recherche multilingue. Dans le cadre du projet, le C²DH développe plus particulièrement une interface d’utilisation comportant de nouvelles fonctions de recherche.

« Pour être conforme aux critères de l’utilisation scientifique de sources historiques, il est tout aussi important de fournir des informations sur l’origine des données et la qualité des annotations générées automatiquement », explique le Dr Marten Düring, coordinateur du projet au C²DH. Cette « transparence » ainsi que le principe de la « générosité », le fait de fournir à l’utilisateur des pistes supplémentaires lui permettant d’étendre sa recherche, sont pour lui déterminants dans la conception de l’interface. Le travail se fait selon une approche interdisciplinaire où historiens, linguistes informaticiens et designers travaillent main en main.

Des ateliers permettent à un panel de chercheurs de donner leur feedback suite à leur propre expérience sur le terrain. De plus, un projet de recherche postdoc du C²DH analyse les mouvements de résistance contre l’idée d’une unification européenne à la fin du XIXe et au début du XXe siècle et contribue en même temps à affiner le nouvel instrument. Il est également prévu d’utiliser les résultats du projet dans l’enseignement de l’Université de Lausanne.

Conférences, workshops et présentations

Bunout, Estelle. “impresso: Media monitoring of the past. Mining 200 years of historical newspapers or how to process data from media archives (and deal with digital bias)“. Workshop on the creation of an international Data for History consortium, 23-24/11/2017, Lyon. 

https://www.c2dh.uni.lu/ ... new-consortium-enable-interoperability-historical-data

Düring, Marten; Bunout, Estelle: Introducing impresso. Media Monitoring of the Past. Forum Z: A new narrative for Europe: Quo Vadis?, 13/10/2017, Esch-sur-Alzette.

https://www.c2dh.uni.lu/forum-z/new-narrative-europe-quo-vadis

Voir aussi

BLIZAAR

Hybrid Visualization of Dynamic Multilayer Graphs

BLIZAAR est un projet de recherche sur les nouvelles techniques de visualisation de données générées dans les domaines des sciences humaines et de la biologie.

en savoir plus

DTU Digital History and Hermeneutics

Unité de formation doctorale (DTU) en Histoire numérique et herméneutique : Source de nouvelles idées !

Les humanités numériques ouvrent de nouvelles voies pour accroître les connaissances dans le domaine des sciences humaines.

en savoir plus

FAMOSO - Fabricating Modern Societies

L’« âge d’acier » au Luxembourg revisité : les technologies du capitalisme utopique et la création d’une identité nationale

L’idée des projets FAMOSO est née en mai 2010 quand le Dr.

en savoir plus

histograph

Graph-based exploration and crowd-based indexation for multimedia collections

Les collections multimédia mettent à disposition des chercheurs et du grand public un nombre souvent impressionnant de documents textuels ou audiovisuels.

en savoir plus

L’État luxembourgeois et les Juifs (années 1930 à 1950)

Une approche micro-historique

La persécution des Juifs par le régime nazi a inclus le Luxembourg occupé pendant la majeure partie de la Seconde Guerre mondiale.

en savoir plus

RANKE 2.0

Critique de source numérique au 21ème siècle

La critique de sources est un fondement du métier d’historien et son enseignement fait partie de tout programme de cours historiographique.

en savoir plus

Éischte Weltkrich

Une exposition digitale sur la Grande Guerre au Luxembourg

La mémoire de la Première Guerre mondiale est un sujet historique qui a interpellé l’opinion publique depuis le centenaire du début des hostilités en 1914.

en savoir plus