Das Datenarchiv des Diccionario del Español Medieval und seine Digitalisierung

865.000 Karteikarten, 33.000 Lemmata, mehr als 1 Million Wortbelege: Das ist die Basis, auf welcher Bodo Müller am Diccionario del Español Medieval (DEM) arbeitete. Nun wird das Datenarchiv des Wörterbuchs im Projekt Diccionario del Español Medieval electrónico (DEMel) digitalisiert.

Mehr als 600 Werke aus der 2. Hälfte des Mittelalters bilden dabei die Basis des Projekts, das ab den späten 70er Jahren durchgeführt und dessen Ergebnisse ab 1987 publiziert wurden – letztlich sind aber nur zwei Bände des Wörterbuchs erschienen (bis zum Lemma almohatac).

Zugunsten einer weiteren Erfassung des altspanischen Wortschatzes werden nun sämtliche Materialien unter der Leitung von Prof. Dr. Rafael Arnold und Prof. Dr. Jutta Langenbacher-Liebgott sowie unter Koordination von Christine Müller an den Universitäten Rostock und Paderborn aufbereitet und digital zur Verfügung gestellt. Das folgende Erscheinungsbild wird sich daher verändern:

Im Video 100 Sekunden Wissenschaft „DEMel“ gibt Stefan Serafin (Uni Rostock) einige Erläuterungen:

Die Daten, die aus diesen Materialien hervorgehen, sind umfangreich und auch bereits in ihrem präeditorischen Zustand aufschlussreich:

Für den DEM wurde zwischen 1979 und 2005 eine umfassende Textbasis von über 600 Werken bzw. Text- und Dokumentsammlungen aus der Periode vom 10. bis zum beginnenden 15. Jahrhundert ausgewertet. Daraus entstanden ca. 650.000 Belegkarten, auf denen die mittelalterlichen Wortformen mit ihrem jeweiligen Verwendungszusammenhang notiert sind. Es können sich dabei auch gleich mehrere dokumentierte Wortformen (Belege) auf einer Karteikarte befinden, so dass sich eine Summe von mehr als 1.000.000 Belegen ergibt. Neben der Fundstelle (Quellentext) und Datierung sind auf den Karteikarten z. B. Angaben zur Wortart (grammatische Informationen) und Bedeutungsangaben verzeichnet, darüber hinaus in einigen Fällen eine Sachgebietszuweisung und Hinweise zur Wortgeschichte bzw. Etymologie. Diese Belege sind bereits einer Lemmatisierung unterzogen, so dass eine Liste von ca. 33.000 Lemmata generiert wurde. Das lexikalische Material wurde entsprechend alphabetisch in 376 Karteikästen sortiert. Außerdem gehören 104 Karteikästen mit „Sekundär“-Karten (Verweise auf etymologische und weitere Fachliteratur, bibliographische Daten u. a.) zu dem Datenarchiv.(DEMel)

Zu den Projektwebsites: romanistik.uni-rostock.de/forschung/sprachwissenschaft/demel/ , kw.uni-paderborn.de/institut-fuer-romanistik/demel/

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.