Open Science – Romanistik-Blog

Qualitative Metadaten – Hilfe und Herausforderung zugleich

Grafik Metadaten — Erstellt auf wordart.com

Vor dem Hintergrund der FAIR-Prinzipien stellt sich die Frage nach der Bedeutung von Metadaten eigentlich gar nicht, leisten sie doch zu zwei der vier in dem Akronym einprägsam zusammengefassten Kategorien einen wesentlichen Beitrag, indem sie eine Forschungsdatenpublikation besser auffindbar (findable) und die Zusammenführung von Datensatznachweisen (interoperable) in institutionen-, länder- oder disziplinübergreifenden Katalogen möglich machen. Soweit die Theorie. Doch wie verhält es sich in der Praxis? Erhalten Metadaten immer die Aufmerksamkeit, die sie verdient haben, oder wirken sie im Schatten der Forschungsleistung und der dafür erforderlichen zeitintensiven Datenerhebung, -aufbereitung und -auswertung eher wie ein notwendiges Übel, eine lästige Pflicht, die es auf dem Weg zur Datenpublikation eben schnell zu erfüllen gilt, um Forschungsförderer und Infrastruktureinrichtungen zufriedenzustellen? Bieten die Systeme und Standards überhaupt die Möglichkeit, Forschungsdaten adäquat – beispielsweise unter Rückgriff auf Normdaten oder mehrsprachig – zu beschreiben? Eine ehrliche Beantwortung dieser Fragen zeigt auf, wo Verbesserungspotenzial besteht. Ziel dieses Beitrags ist es, ebenso ein Bewusstsein für die Herausforderungen bei der Erschließung von Forschungsdaten zu wecken wie für den hilfreichen Nutzen, der sich aus dem Bemühen um qualitativ hochwertige Metadaten ergibt. Mit dem Begriff „Metadaten“ sind in diesem Beitrag die bei der Publikation von Forschungsdaten hinzugefügten, das Forschungsprojekt sowie die hinterlegten Datensätze beschreibenden Informationen gemeint. Im Rahmen der Aufbereitung der Rohdaten zur Beantwortung der Forschungsfrage ergänzte strukturierende und beschreibende Elemente wie Annotationen oder Markup-Elemente (bspw. der TEI-Header, XML-Tags usw.) werden hingegen als Bestandteil der von den Metadaten unterschiedenen Forschungsdaten betrachtet.
„Qualitative Metadaten – Hilfe und Herausforderung zugleich“ weiterlesen

Spaniens Digitalisierungsstrategie

Spanien hat am 30.11.2021 eine nationale Digitalisierungsstrategie veröffentlicht. Diese zielt auf das Zusammenführen und Stärken existierender Initiativen zur Digitalisierung des kulturellen Erbes, aber auch auf eine inhaltliche Diversifizierung und die Einrichtung neuer Förderprogramme. Bemerkenswert ist das angekündigte Ziel, das kulturelle Dokumentenerbe an die Unterhaltungsindustrie anzubinden.

Mit dieser Strategie reagiert das Kulturministerium auf das bisher heterogene Vorgehen von zahlreichen Akteuren und Projekten im Bereich der Digitalisierung, die seit den 90er Jahren ihre Digitalisate in unterschiedlichen Formaten und Plattformen präsentieren. Konstatiert werden auch Verluste aufgrund fehlender Kompatibilität und fehlender Standards sowie eine mangelnde Diversität der Inhalte:

„Spaniens Digitalisierungsstrategie“ weiterlesen

Vortrag von Christof Schöch über Open Access

„Digitale Publikationen können mehr sein als digitalisierte Druckerzeugnisse“ – so eine der Thesen von Christof Schöch in seinem Vortrag „Was heißt und zu welchem Ende publiziert man im Open Access?“. Schöch ist Romanist und Professor für Digital Humanities an der Universität Trier und hielt diesen Vortrag zur diesjährigen internationalen Open-Access-Week im Rahmen der Veranstaltungen der UB Trier:

„Vortrag von Christof Schöch über Open Access“ weiterlesen

FAIRe Daten in den Literaturwissenschaften? Das Beispiel „Mining and Modeling Text“ und der französische Roman des 18. Jahrhunderts

Julia Röttgermann und Christof Schöch

What is FAIR DATA? Quelle: Ligue des Bibliothèques Européennes de Recherche, CC-BY

Gemäß der Fair Data Principles sollen Forschungsdaten “Findable, Accessible, Interoperable, and Re-usable“, also auffindbar, zugänglich, interoperabel und nachnutzbar sein. In der vorliegenden Blogserie zu FAIR-Prinzipien im Kontext romanistischer Projekte wurden bereits die Bedeutung von Repositorien und FAIR data im Kontext der Lexikographie diskutiert.

Im Projekt “Mining and Modeling Text” (2019–2022) des Trier Center for Digital Humanities ist ein Team aus der Computerlinguistik, der Romanistik, der Informatik und der Rechtswissenschaft dabei, ein mehrgliedriges Informationsangebot aufzubauen. Die Informationen speisen sich aus drei Quellen: Primärtexte (französische Romane der Zeit 1750-1800), Sekundärliteratur (relevante literaturhistorische Werke) und relevante bibliographische Daten.

Geleitet von der Idee von Linked Open Data werden die Romane in TEI-konformes XML gewandelt und mit Normdaten wie Wikidata verknüpft. Die Vision des Forschungsprojekts ist es, literaturhistorisch relevante Informationen maschinell zu extrahieren und so in Form von einfachen Aussagen zu modellieren, dass sie im Sinne des Semantic Web abfragbar (via SPARQL) zur Verfügung stehen.

Doch sind die bisher erhobenen Forschungsdaten den FAIR-Prinzipien entsprechend gut zugänglich, umfänglich erläutert, mit entsprechenden Lizenzen versehen und stehen sie nachnutzbar aufbereitet für die Forschungscommunity zur Verfügung?

„FAIRe Daten in den Literaturwissenschaften? Das Beispiel „Mining and Modeling Text“ und der französische Roman des 18. Jahrhunderts“ weiterlesen

#ChronoAlex: auf Expedition mit Alexander von Humboldt

Anlässlich des 250. Geburtstages von Alexander von Humboldt am 12.09.2019 wurde bereits viel über den weit gereisten Naturforscher berichtet. Nun kann man sich selbst auf die Spuren seiner berühmten Forschungsreisen begeben. Mithilfe historischer Karten hat CHRONO RESEARCH LAB eine interaktive Karte erstellt, mit der z.B. die einzelnen Stationen der amerikanischen Forschungsreise (1799-1804) erkundet werden können.
„#ChronoAlex: auf Expedition mit Alexander von Humboldt“ weiterlesen

Der ORION Open Science Podcast

Erfüllen anerkannte Mechanismen der Qualitätssicherung wie peer review überhaupt ihren Zweck? Sind bei aller Diskussion um fake journals nicht sogar Zeitschriften selbst ein Teil des Problems? Der ORION-Podcast bietet eine Reihe von Interviews zum Anhören über Open Science-Themen an. Darin werden mitunter provokante Fragen gestellt oder Thesen aufgestellt. „Der ORION Open Science Podcast“ weiterlesen

Frei lizenzierte Abbildungen finden mit CC Search

Beim Einbinden von Abbildungen oder anderen Inhalten stellt sich regelmäßig die Frage, ob das Weiterverwenden (oder gar Bearbeiten) legal ist. Mit der Suchmaschine CC Search lässt sich gezielt nach Inhalten mit Creative Commons-Lizenz suchen.

Eine Beispielsuche nach „Federico García Lorca“ ergibt 57.717 Treffer. Fährt man mit der Maus über eine Abbildung, wird die vergebene Lizenz eingeblendet:
„Frei lizenzierte Abbildungen finden mit CC Search“ weiterlesen

Über rechtliche Aspekte der digitalen Welt informiert durch iRights.info

Seit 2005 informiert iRights.info über das Urheberrecht und über andere rechtliche Aspekte der digitalen Welt. Auch für die Romanistik sind die zahlreichen Informationen relevant, geht doch die Relevanz des Themenpaars „Urheberrecht und kreatives Schaffen in der digitalen Welt“ weit über Filesharing und das Hochladen von Youtube-Videos hinaus. „Über rechtliche Aspekte der digitalen Welt informiert durch iRights.info“ weiterlesen