Umfrage zu literarischen Korpora: Wie wählen Sie Ihre Texte aus?

Spezifische Forschungsfragen erfordern maßgeschneiderte Korpora. Wer zu spanischen Kriminalromanen um die vorletzte Jahrhundertwende arbeiten möchte, kann wahrscheinlich keine Übersetzungen ursprünglich englischer Gruselgeschichten in seinem Korpus brauchen oder Theaterstücke, in denen zufällig ein Detektiv auftaucht. Recherchemöglichkeiten nach den entsprechenden Kriterien – z. B. Sprache, Genre, Zeitraum – scheinen die naheliegende Antwort zu sein. Um diesbezüglich langfristig die Recherchesituation zu verbessern, läuft bis zum 30.09.2025 eine Umfrage zu den für Sie und Ihre Forschung wichtigen Kriterien. Machen Sie mit!

Dekoratives Bild, das ein Buch auf einem Haufen von Buchseiten unter blauem Himmel zeigt.
Anhand welcher Merkmale würden Sie gerne nach Texten suchen können?

„Umfrage zu literarischen Korpora: Wie wählen Sie Ihre Texte aus?“ weiterlesen

Corpus of Novels of the Spanish Silver Age im TextGrid Repositorium

TextGrid: Corpus of Novels of the Spanish Silver Age

Passend zur gerade in Luxembourg und Trier stattfinden Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ – DHd 2023 Open Humanities Open Culture weisen wir auf ein sehr interessantes hispanistisches Digital-Humanities-Projekt hin. Im Blog des NFDI-Konsortiums Text+ berichtet José Calvo Tello von der Integration eines von ihm aufbereiteten Korpus‘ spanischer Romane aus dem „Silver Age“ in das TextGrid Repositorium. Zum Korpus führt er dort aus:
Corpus of Novels of the Spanish Silver Age im TextGrid Repositorium“ weiterlesen

Las humanidades digitales como expresión y estudio del patrimonio digital

In diesen Tagen wurde der Sammelband mit den Ergebnissen des „IV Congreso Internacional de la Asociación de Humanidades Digitales Hispánicas“ (Info) im Open Access veröffentlicht, der vom 23. -25. Oktober 2019 an der Facultad de Humanidades de Toledo der Universidad de Castilla-La Mancha stattgefunden hatte. Im Abstract des Bandes, der unter dem Oberbegriff „Digitale Geisteswissenschaften als Ausdruck und Untersuchung des digitalen Erbes“ steht, heißt es:

„Las humanidades digitales como expresión y estudio del patrimonio digital“ weiterlesen

Creating the European Literary Text Collection (ELTeC): Challenges and Perspectives

In der Open-Access-Zeitschrift MLO (Modern Languages Open) haben Christof Schöch, Roxana Patras, Tomaž Erjavec und Diana Santos einen interessanten Artikel veröffentlicht, auf den wir die romanistische Fachcommunity gerne hinweisen möchten: „Creating the European Literary Text Collection (ELTeC): Challenges and Perspectives

Im Abstract heißt es einführend:

The aim of this contribution is to reflect on the process of building the multilingual European Literary Text Collection (ELTeC) that is being created in the framework of the networking project Distant Reading for European Literary History funded by COST (European Cooperation in Science and Technology). To provide some background, we briefly introduce the basic idea of ELTeC with a focus on the overall goals and intended usage scenarios. We then describe the collection composition principles that we have derived from the usage scenarios. In our discussion of the corpus-building process, we focus on collections of novels from four different literary traditions as components of ELTeC: French, Portuguese, Romanian, and Slovenian, selected from the more than twenty collections that are currently in preparation.

„Creating the European Literary Text Collection (ELTeC): Challenges and Perspectives“ weiterlesen

Brückenschlag zwischen Narratologie und Digital Humanities: Toward Undogmatic Reading – Narratology, Digital Humanities and Beyond

Toward Undogmatic Reading Bei dem im Verlag Hamburg University Press gedruckt und im Open Access veröffentlichten Sammelband «Toward Undogmatic Reading – Narratology, Digital Humanities and Beyond» handelt es sich um eine Festschrift zu Ehren von Jan Christoph Meister, dessen Name eng verbunden ist mit der Verschmelzung der Literaturwissenschaft und den Möglichkeiten einer computergestützten Analyse, lange bevor sich der Begriff Digital Humanities herausgebildet hat. Die Herausgeber*innen Marie Flüh, Dr. Jan Horstmann, Dr. Janina Jacke und Mareike Schumacher führen in der Einführung dazu aus:

„Brückenschlag zwischen Narratologie und Digital Humanities: Toward Undogmatic Reading – Narratology, Digital Humanities and Beyond“ weiterlesen

Spanischsprachiges Tutorial zu Topic Modeling und MALLET

Introducción a Topic Modeling y MALLET

Romanistisch Forschende, die überlegen Methoden des Topic Modelling im Rahmen ihrer Forschung anzuwenden, finden in diesem Tutorial der hilfreichen Initiative „The programming historian“ eine gute Einführung. Ulrike Henny-Krahmer hat sich die Mühe gemacht, die bereits existierende Anleitung «Introducción a Topic Modeling y MALLET» von Shawn Graham, Scott Weingart und Ian Milligan gemeinsam mit anderen ins Spanische zu übersetzen und anzupassen: «Introducción a Topic Modeling y MALLET».

Im Topic Modelling geht es darum eine digital vorliegende Datenmenge (z.B. Textkorpora) automatisiert in unterschiedliche Themenbereiche zu unterteilen. Oder wie es im Tutorial beschrieben ist:
„Spanischsprachiges Tutorial zu Topic Modeling und MALLET“ weiterlesen

Quantitative Untersuchung zu Calderón de la Barca

Zu welchen Ergebnissen man kommen kann, wenn Methoden der Digital Humanities auf die Untersuchung von Dramen angewandt werden, zeigt eine aktuelle Veröffentlichung in der neuen Ausgabe der Zeitschrift Revista de Humanidades Digitales. Prof. Dr. Hanno Ehrlicher und sein Mitarbeiter Dr. Jörg Lehmann (Romanische Philologie, Univ. Tübingen), sowie Dr. Nils Reiter (Univ. Köln) und Dr. Marcus Willand (Univ. Heidelberg) präsentieren hier eindrucksvoll und nachvollziehbar die Ergebnisse ihrer quantitativen Untersuchung zu Calderón de la Barca.

La poética dramática desde una perspectiva cuantitativa: la obra de Calderón de la Barca
„Quantitative Untersuchung zu Calderón de la Barca“ weiterlesen

FAIRe Daten in den Literaturwissenschaften? Das Beispiel „Mining and Modeling Text“ und der französische Roman des 18. Jahrhunderts

Julia Röttgermann und Christof Schöch

What is FAIR DATA?
What is FAIR DATA? Quelle: Ligue des Bibliothèques Européennes de Recherche, CC-BY

Gemäß der Fair Data Principles sollen Forschungsdaten “Findable, Accessible, Interoperable, and Re-usable“, also auffindbar, zugänglich, interoperabel und nachnutzbar sein. In der vorliegenden Blogserie zu FAIR-Prinzipien im Kontext romanistischer Projekte wurden bereits die Bedeutung von Repositorien und FAIR data im Kontext der Lexikographie diskutiert.

Im Projekt “Mining and Modeling Text” (2019–2022) des Trier Center for Digital Humanities ist ein Team aus der Computerlinguistik, der Romanistik, der Informatik und der Rechtswissenschaft dabei, ein mehrgliedriges Informationsangebot aufzubauen. Die Informationen speisen sich aus drei Quellen: Primärtexte (französische Romane der Zeit 1750-1800), Sekundärliteratur (relevante literaturhistorische Werke) und relevante bibliographische Daten.

Geleitet von der Idee von Linked Open Data werden die Romane in TEI-konformes XML gewandelt und mit Normdaten wie Wikidata verknüpft. Die Vision des Forschungsprojekts ist es, literaturhistorisch relevante Informationen maschinell zu extrahieren und so in Form von einfachen Aussagen zu modellieren, dass sie im Sinne des Semantic Web abfragbar (via SPARQL) zur Verfügung stehen.

Doch sind die bisher erhobenen Forschungsdaten den FAIR-Prinzipien entsprechend gut zugänglich, umfänglich erläutert, mit entsprechenden Lizenzen versehen und stehen sie nachnutzbar aufbereitet für die Forschungscommunity zur Verfügung?

„FAIRe Daten in den Literaturwissenschaften? Das Beispiel „Mining and Modeling Text“ und der französische Roman des 18. Jahrhunderts“ weiterlesen