Gallica, die seit 1997 im Open Access zugängliche digitale Bibliothek der Bibliothèque nationale de France (BnF), umfasst inzwischen (Stand: Dezember 2021) mehr als 8.400.000 digitalisierte Dokumente: Katalogisiert sind neben rund 1.200.000 Büchern, 200.000 Handschriften und 5.300.000 Zeitschriften- und Zeitungsausgaben u.a. auch ca. 180.000 Karten, 1.600.000 Bilder sowie über 51.000 Tonaufnahmen.
Insbesondere aufgrund der Vielzahl an digitalisierten Texten ist die ursprünglich in viel kleineren Dimensionen als „bibliothèque virtuelle de l’honnête homme“ konzipierte Datenbank heute auch für die romanistische Sprach- und Literaturwissenschaft von nicht unerheblichem Interesse. Sie kann gewissermaßen als Repositorium (vgl. den Beitrag von Rißler-Pipka in diesem Blog) für Rohdaten angesehen werden, die als Grundlage für verschiedenste Studien dienen können, so dass sich die Frage stellt, wie FAIRdie von Gallica zur Verfügung gestellten Daten eigentlich sind.
In der heute veröffentlichten Folge „Bibliotecarios por el mundo – Alemania“ des spanischen bibliothekarischen YouTube-Kanals BiblioTeConecta war ich eingeladen, mit den spanischen Kolleg*innen über das deutsche Bibliothekssystem zu sprechen. Ich haben ihnen von der Arbeit der Fachinformationsdienste und der Kommunikation in den Sozialen Medien berichtet: „BiblioTeConecta: Bibliotecarios por el mundo – Alemania“ weiterlesen
Vor dem Hintergrund der FAIR-Prinzipien stellt sich die Frage nach der Bedeutung von Metadaten eigentlich gar nicht, leisten sie doch zu zwei der vier in dem Akronym einprägsam zusammengefassten Kategorien einen wesentlichen Beitrag, indem sie eine Forschungsdatenpublikation besser auffindbar (findable) und die Zusammenführung von Datensatznachweisen (interoperable) in institutionen-, länder- oder disziplinübergreifenden Katalogen möglich machen. Soweit die Theorie. Doch wie verhält es sich in der Praxis? Erhalten Metadaten immer die Aufmerksamkeit, die sie verdient haben, oder wirken sie im Schatten der Forschungsleistung und der dafür erforderlichen zeitintensiven Datenerhebung, -aufbereitung und -auswertung eher wie ein notwendiges Übel, eine lästige Pflicht, die es auf dem Weg zur Datenpublikation eben schnell zu erfüllen gilt, um Forschungsförderer und Infrastruktureinrichtungen zufriedenzustellen? Bieten die Systeme und Standards überhaupt die Möglichkeit, Forschungsdaten adäquat – beispielsweise unter Rückgriff auf Normdaten oder mehrsprachig – zu beschreiben? Eine ehrliche Beantwortung dieser Fragen zeigt auf, wo Verbesserungspotenzial besteht. Ziel dieses Beitrags ist es, ebenso ein Bewusstsein für die Herausforderungen bei der Erschließung von Forschungsdaten zu wecken wie für den hilfreichen Nutzen, der sich aus dem Bemühen um qualitativ hochwertige Metadaten ergibt. Mit dem Begriff „Metadaten“ sind in diesem Beitrag die bei der Publikation von Forschungsdaten hinzugefügten, das Forschungsprojekt sowie die hinterlegten Datensätze beschreibenden Informationen gemeint. Im Rahmen der Aufbereitung der Rohdaten zur Beantwortung der Forschungsfrage ergänzte strukturierende und beschreibende Elemente wie Annotationen oder Markup-Elemente (bspw. der TEI-Header, XML-Tags usw.) werden hingegen als Bestandteil der von den Metadaten unterschiedenen Forschungsdaten betrachtet. „Qualitative Metadaten – Hilfe und Herausforderung zugleich“ weiterlesen
The aim of this contribution is to reflect on the process of building the multilingual European Literary Text Collection (ELTeC) that is being created in the framework of the networking project Distant Reading for European Literary History funded by COST (European Cooperation in Science and Technology). To provide some background, we briefly introduce the basic idea of ELTeC with a focus on the overall goals and intended usage scenarios. We then describe the collection composition principles that we have derived from the usage scenarios. In our discussion of the corpus-building process, we focus on collections of novels from four different literary traditions as components of ELTeC: French, Portuguese, Romanian, and Slovenian, selected from the more than twenty collections that are currently in preparation.
Warum überhaupt Open Access? Wer – außer der neuen Bundesregierung – will das denn tatsächlich? Und was hat das mit der Romanistik, ihren Verlagen und den Bibliotheken zu tun? Einen öffentlichen Kurzvortrag dazu organisiert der Bremer Romanistik-Fachreferent Dr. Martin Mehlberg in Kooperation mit dem FID als mittägliche Coffee Lecture. Sie findet statt im Rahmen der Themenwoche Romanistik der Staats- und Universitätsbibliothek Bremen.
Molière in der Rolle des Cäsar, Porträt von Nicolas Mignard, 1658. Quelle: Wikipedia Am kommenden Samstag, den 15. Januar, ist der 400. Geburtstag von Molière (1622-1673). Der 15.01.1622 war sein Tauftag, das genaue Geburtsdatum ist nicht bekannt. Frankreich wird den Ehrentag des großen Klassikers mit mehreren Festakten begehen. Die Comédie-Française hat im Rahmen von «MOLIÈRE 2022 – 400e ANNIVERSAIRE 1622-2022» über das ganze Jahr mehrere Molière-Aufführungen geplant, beginnend mit dem Tartuffe, deren kommende Termine – wie so oft in diesen Tagen – pandemiebedingt bereits abgesagt werden mussten. „400. Geburtstag von Molière“ weiterlesen
Beschleunigung und Nachhaltigkeit sind zwei komplementäre Themen im aktuellen Diskurs über die Digitalisierung und speziell auch über digitale wissenschaftliche Publikationen. Ein Beitrag von Philipp Hegel, Michael Krewet, Andrea Rapp auf Logbuch Wissensgeschichte nähert sich der Frage, wie sich neu entwickelnde Infrastrukturen zum Wissen und dessen Veränderungen verhalten:
Wenn digitale Infrastrukturen epistemische Prozesse schneller werden lassen und zugleich deren Ergebnisse verstetigen, dann muss dieses Wissen, wenn es nicht nur gespeicherte Information bleiben soll, immer noch intellektuell durchdrungen werden. Können digitale Infrastrukturen dieses Problem, das sie zum Teil selbst befördern, auch ein Stück weit zu lösen helfen? (logbuch-wissensgeschichte.de)