Histoire numérique et l’historiographie

Werkstattbericht: Workshop rund um Re-Use digitalisierter Zeitungen & Zeitschriften in Darmstadt

Werkstattbericht: Workshop rund um Re-Use digitalisierter Zeitungen & Zeitschriften in Darmstadt
Ein zweitägiger Workshop zur Nachnutzung digitalisierter historischer Zeitungen und Zeitschriften fand am 13. und 14. Mai 2024 in Darmstadt statt.

Die Veranstaltung wurde gemeinsam von der Arbeitsgruppe Zeitungen & Zeitschriften der DHd und der Universitäts- und Landesbibliothek Darmstadt (ULB) ausgerichtet. Dabei bildet sie den ersten Teil einer umfassenden Workshop-Reihe zum Thema "Nachnutzung digitalisierter Pressebestände" im deutschsprachigen Raum.

Die von 2023-2024 stattfindende Reihe zielt darauf ab, Re-Use rund um digitalisierte Zeitungen und Zeitschriften zu erforschen und zu fördern, indem sowohl bestehende, wiederverwendbare Ressourcen offengelegt als auch Nachnutzungspraktiken und -workflows kritisch hinterfragt werden. Vor diesem Hintergrund werden sowohl theoretische Konzeptdiskussionen als auch praktische Anwendungsmöglichkeiten durch eine Mischung aus Vorträgen, Diskussionsrunden und Hackathon-Formaten miteinbezogen. Insgesamt beleuchten vier Workshops jeweils spezifische Aspekte:

  1. Wiederverwendung verstehen (Darmstadt, Mai 2024): Vertiefung des Konzeptverständnisses von Re-Use speziell für historische Zeitungen im deutschsprachigen Kontext
  2. Summer School zur digitalen Analyse digitalisierter Zeitungen & Zeitschriften: Re-Use bestehender Infrastrukturen und Tools (Zürich, September 2024) 
  3. KI-Modelle in Aktion (Wien, Mai 2025): Einsatz von KI-Methoden für historische Zeitungen und Zeitschriften
  4. Silos aufbrechen (Belval/Luxemburg, Herbst 2025): Visionäre Zukunftsszenarien jenseits nationaler Grenzen

Das Programm in Darmstadt begann mit einer Präsentation verschiedener digitaler Zeitungssammlungen, nämlich von zeit.punktNRW (https://zeitpunkt.nrw, präsentiert durch Stefanie Läpke), e-newspaperarchives.ch (https://www.e-newspaperarchives.ch, präsentiert von Jesko Reiling), dem Bonn Newspaper Dataset der Kölnischen Zeitung (präsentiert von Kara Kuebart), der Impresso-Sammlung (https://impresso-project.ch, präsentiert von Estelle Bunout), dem Presseausschnittarchivs des Herder-Instituts (https://www.herder-institut.de/pressesammlung, präsentiert von Cristina Vertan) und dem Deutschen Zeitungsportal (https://www.deutsche-digitale-bibliothek.de/newspaper, präsentiert von Lisa Landes).

Im Rahmen dieser ersten Session zeigte sich eine Vielfalt an digitalen Portalen und Datensätze historischer Zeitungen und Zeitschriften - manche für die breite Öffentlichkeit, andere forschungsorientiert - sowie der Trend, zunehmend OAI-Schnittstellen zum Datenabruf anzubieten, nicht nur Stichwortsuchfunktionen. Auch die Inhalte der Sammlungen variieren stark von einzelnen, bereits tieferschlossenen Titeln über Mehrfachtitel-Korpora bis hin zu Presseausschnitt-Archiven von Bibliotheken und Forschungseinrichtungen. Diese jeweilige Aufbereitung der einzelnen Angebote beeinflusst wiederum die Möglichkeiten des Datenzugriffs und -einsatzes für computergestützte Analysen.

In diesem Sinne hat sich der zweite Teil der Vorstellung bestehender und nachnutzbarer digitaler Methoden, Tools und Jupyter Notebooks für die Arbeit mit digitalisierten Zeitungen und Zeitschriften gewidmet. Konkret präsentierte Sarah Oberbichler Methoden für Korpusbildung, Johanna Störiko ein Tool zur Segmentierung von Anzeigenseiten, Olivia Varwig die virtuelle Editionsplattform „Forschungsnetzwerk und Datenbanksystem“ und das Tool Transcribo, Nina C. Rastinger ein Jupyter Notebook für NER und Kara Kuebart zwei Jupyter Notebooks für Sentiment Analysis und Topic Modelling.

Im Anschluss an diese Ressourcenpräsentationen wurden Überlegungen zur Verbindung von Daten und Werkzeugen in Form einer Expertenrunde aufgegriffen, in der drei ausgewählte methodische Anwendungsfälle (Layoutanalyse, Named Entity Recognition, Rubrikenerkennung) in Kleingruppen diskutiert wurden – mit dem Ziel Best Practices zu entwickeln und die Basis für einen Überblicksartikel zu Re-Use rund um digitalisierte Zeitungen und Zeitschriften zu erarbeiten.

Am zweiten Workshoptag stand die Präsentation der digitalen Edition des Darmstädter Tagblatts durch das Team der Universitäts- und Landesbibliothek (ULB) Darmstadt im Mittelpunkt. Ausgehend hiervon fand im Anschluss ein Hackathon statt, bei dem die Teilnehmenden die Möglichkeit hatten, mehrere am vorherigen Tag vorgestellte Tools auf das Datenset des Darmstädter Tagblatts anzuwenden, um die Potenziale und Limitationen dieser Kombinationen zu erproben und wertvolle praktische Erkenntnisse rund um Re-Use zu gewinnen.

Über diese diversen Zugänge hat der Workshop einen vielseitigen Start in die thematische Workshopreihe ermöglicht und den internationalen, fachlichen Austausch über Konzepte und Techniken der Nachnutzung von Zeitungs- und Zeitschriftendaten gefördert. Die gesammelten Erkenntnisse sollen in einer Abschlusspublikation zusammengefasst und als Leitfaden für künftige Projekte bereitgestellt werden. Zudem ist ein Ressourcenkatalog bestehender Zeitungs- und Zeitschriftensammlungen auf der Website der Arbeitsgruppe (https://dhd-ag-zz.github.io/) in Vorbereitung.

 

Universitäts- und Landesbibliothek Darmstadt (ULB)