Graph-based exploration and crowd-based indexation for multimedia collections

01-2015...

histograph

Les collections multimédia mettent à disposition des chercheurs et du grand public un nombre souvent impressionnant de documents textuels ou audiovisuels. Explorer ces données de manière efficace n’est pas toujours chose aisée.

1 / 4

L’utilisateur qui introduit par exemple le nom de Robert Schuman dans un masque de recherche de texte risque de retrouver dans la liste de résultats des documents où il est fait mention d’une rue, d’un bâtiment ou d’un hôpital portant le nom de l’homme d’Etat mais pas de Robert Schuman en tant que personne. Retrouver des photos ou vidéos où il figure, peut aussi s’avérer difficile s’il n’est pas mentionné dans un texte accompagnant. Par contre, une recherche par entités, basée sur des concomitances de personnes, organisations, lieux, dates etc. dans un document permet de mieux cibler la recherche automatique. Cette hypothèse est à la base d’une application développée au sein du C²DH et qui porte le nom de « histograph ».

Comme le nom l’indique, cette exploration est surtout graphique. Affinée à l’aide de modèles mathématiques, la concomitance de noms permet d’établir des réseaux de lignes de relations plus ou moins prononcées entre plusieurs personnes ou autres entités, l’utilisateur ayant pu faire un filtrage préalable en ce qui concerne par exemple la période ou le type de documents à prendre en considération. L’affichage des résultats peut alternativement se faire en affichant sous forme d’étoile le réseau de relations qui part d’une personne choisie.

Ce qui fait aussi l’originalité du histograph, est la participation de l’utilisateur prévue par l’application. Il peut ainsi confirmer ou infirmer, pour un document choisi, qu’un résultat d’analyse automatique représente réellement une entité, que ce nom est bien mentionné dans le texte en question ou que cette personne figure sur telle photo. Il peut aussi confirmer l’annotation d’un autre utilisateur ou bien la contredire. Les développeurs ont ainsi prévu un système de validation à plusieurs niveaux qui tient également compte de l’expérience des utilisateurs montrée à travers leurs annotations respectives. « C’est l’apport humain que fait la force de cette application parce qu’il permet de corriger les imperfections de la détection automatique », résume le Dr-Ing Lars Wieneke, en charge de l’élaboration du projet. Une fois finalisé, histograph doit pouvoir faciliter la recherche dans tout type de collections multimédia.

Voir aussi

BLIZAAR

Hybrid Visualization of Dynamic Multilayer Graphs

BLIZAAR est un projet de recherche sur les nouvelles techniques de visualisation de données générées dans les domaines des sciences humaines et de la biologie.

en savoir plus

DTU Digital History and Hermeneutics

Unité de formation doctorale (DTU) en Histoire numérique et herméneutique : Source de nouvelles idées !

Les humanités numériques ouvrent de nouvelles voies pour accroître les connaissances dans le domaine des sciences humaines.

en savoir plus

FAMOSO - Fabricating Modern Societies

L’« âge d’acier » au Luxembourg revisité : les technologies du capitalisme utopique et la création d’une identité nationale

L’idée des projets FAMOSO est née en mai 2010 quand le Dr.

en savoir plus

impresso – Media monitoring the past

Comment mieux tirer parti des journaux historiques

Les journaux historiques constituent un fonds essentiel pour la recherche scientifique, la digitalisation facilitant l’accès à ces sources.

en savoir plus

L’État luxembourgeois et les Juifs (années 1930 à 1950)

Une approche micro-historique

La persécution des Juifs par le régime nazi a inclus le Luxembourg occupé pendant la majeure partie de la Seconde Guerre mondiale.

en savoir plus

RANKE 2.0

Critique de source numérique au 21ème siècle

La critique de sources est un fondement du métier d’historien et son enseignement fait partie de tout programme de cours historiographique.

en savoir plus

Éischte Weltkrich

Une exposition digitale sur la Grande Guerre au Luxembourg

La mémoire de la Première Guerre mondiale est un sujet historique qui a interpellé l’opinion publique depuis le centenaire du début des hostilités en 1914.

en savoir plus