Die Revista Frenopática Española war eine der wichtigsten Fachzeitschriften der jungen spanischen Psychiatrie, herausgegeben von Dr. Antonio Rodríguez – Morini (1863-1937). Renommierte internationale Autor:innen veröffentlichten zu Beginn des 20. Jahrhunderts Erkenntnisse aus der klinischen Praxis und Wissenschaft, darunter Nachrichten aus der Psychoanalyse, chirurgischen Praxis oder auch Berichte über internationale Fachkongresse. Die Sammlung Prensa Histórica der spanischen Nationalbibliothek bewahrt die Jahrgänge von 1904-1912 in ihrem Bestand und hat die Scans in der Hermeroteca digital der breiten Öffentlichkeit zur Verfügung gestellt.
Mittels automatisierter Texterkennung soll der Inhalt durchsuchbar und somit auch leichter erforschbar gemacht werden. Für die menschliche Korrektur der automatischen Ergebnisse bittet die Nationalbibliothek nun die Öffentlichkeit um Mithilfe – und das nicht zum ersten Mal.
Bei der Digitalisierung werden gedruckte Dokumente zunächst in ein Bild umgewandelt. Anschließend wird der Text mittels OCR-Technologie (Optical Character Recognition) digital erkannt und gewissermaßen aus dem Digitalisat extrahiert. Aus verschiedenen Gründen (Kontrast, Schriftarten und -zeichen oder Textlayout usw.) kann es bei diesem automatischen Prozess zu Fehlern kommen, die einer menschlichen Korrektur bedürfen.
Die Überarbeitung und Korrektur dieses Textes ermöglicht eine genauere Suche, trägt zur Schaffung eines „sauberen“ Textkorpus bei oder erleichtert die Produktion anderer Formate wie EPUB und macht ihn für jedermann zugänglich.
Dafür bittet die Biblioteca Nacional de España nun um Mithilfe: Über die Plattform Comunidad BNE soll online und kollaborativ an derzeit 27 Projekten rund um das digitalisierte Kulturerbe gearbeitet werden – darunter auch die OCR-Korrektur der Revista Frenopática Española. Wie das geht, zeigt dieses Tutorial:
Für die OCR-Korrektur der Zeitschrift wurden insgesamt 3442 Aufgaben angelegt, die nun von Freiwilligen nach und nach online abgearbeitet werden können. Als einen weiteren Anreiz gibt es eine öffentliche Rangliste der fleißigsten User:innen.
Dabei scheint die Plattform sehr erfolgreich zu sein: Von den bisher 27 angelegten Projekten wurden bereits bei 17 alle der offenen Aufgaben von Bürger:innen erledigt, darunter häufig manuelle Korrektur von OCR-Ergebnissen von Zeitschriften, aber auch gesammelter Speisekarten.
Wir laden Sie ein, uns bei der Transkription einer Reihe von Bankettmenüs zu helfen, die für gesellschaftliche Anlässe wie Hochzeiten oder offizielle Empfänge zubereitet wurden und die wir in unserer Ephemera-Sammlung aufbewahren.
Auf der Plattform Comunidad BNE können darüber hinaus auch Gedichte transkribiert, Tonaufnahmen verschriftlicht, Musik nach Genres sortiert oder historische Fotografieren lokalisiert werden. Wer sich einen Überblick verschaffen möchte, kann dies hier tun. Auch Vorschläge für neue Croudsourcing-Projekte (Wiki) im Bestand der BNE nehmen die Mitarbeiter:innen der spanischen Nationalbibliothek entgegen. Mit dieser Art der Bürger:innenbeteiligung versucht die Bibliothek nicht nur die bibliothekarischen Herausforderungen der Digitalisierung zu bewältigen, sondern auch eine engere Vernetzung mit der Bevölkerung zu erlangen und mehr Aufmerksamkeit für die jeweiligen digitalisierten Bestände zu generieren.
La plataforma permitirá reunir voluntarios para la realización de tareas colaborativas a partir del fondo digitalizado de la BNE, con el objetivo de difundirlo y crear nueva información igualmente a disposición de todos.