Contemporary history of Europe

Les archives du Web, entre science et artisanat

« [P]arce que le Web est un média de “traces”, son archivage ne peut que répondre aux préoccupations ontologiques de l’historien qui s’appuie sur l’ensemble des traces héritées du passé pour les constituer en documents afin de les interroger », notait en 2012 Claude Mussou, alors responsable du dépôt légal du Web à l’Institut national de l’audiovisuel. Les masses de données que forment aujourd’hui les archives du Web, conservées par plusieurs institutions depuis l’initiative pionnière de la fondation Internet Archive créée par Brewster Kahle il y a vingt ans, constituent un matériel pléthorique . Leur valeur patrimoniale a été reconnue par une charte de l’Unesco sur le patrimoine numérique en 2003 . Leur exploitation dans le monde de la recherche est cependant récente et prudente. Richard Rogers a même pu parler « [...] de crise dans certains domaines de recherche en humanités numériques, car l’accueil réservé par les chercheurs à ces nouveaux documents n’a pas été à la hauteur de cette ruée vers la numérisation. Par exemple, les archives Web sont encore rarement utilisées à des fins scientifiques [...] . » Si la tendance est en passe d’évoluer, le défi demeure pour les chercheurs, en terme à la fois de compréhension de ce qu’est le Web archivé, de création de corpus et d’analyse.

http://hdl.handle.net/10993/35502