KI-gestützte Literaturrecherche in der Romanistik – ein Erfahrungsbericht

Das Angebot wissenschaftlicher Suchwerkzeuge wurde in den letzten Jahren um eine neue Kategorie erweitert: Neben die Online-Kataloge der Bibliotheken, bibliographische Datenbanken und Fachportale wie das Suchportal des FID Romanistik sind zahlreiche Anbieter KI-gestützter Recherchetools getreten. Wissenschaftliche Recherchen erfordern dadurch nicht weniger Kompetenzen, aber zum Teil andere. Welche dazu derzeit zählen, zeichnet der vorliegende Erfahrungsbericht nach. Er basiert auf der wiederholten Beschäftigung der Autorin mit KI-gestützten Recherchetools und ihrer zweifachen Perspektive auf die Thematik sowohl als Romanistin als auch als wissenschaftliche Bibliothekarin. Wie es in einem sich dynamisch entwickelnden Feld nicht anders sein kann, handelt es sich dabei um eine Momentaufnahme der bisher gewonnenen Eindrücke. Zukünftige Veränderungen der genutzten Suchwerkzeuge sind nicht nur wahrscheinlich, sondern auch wünschenswert. Die Besonderheiten von KI-gestützten Tools für die Literaturrecherche und damit einhergehende Nutzungsanforderungen werden im Folgenden gemäß der typischen drei Phasen einer Recherche von der Auswahl des Rechercheinstruments über die Formulierung der Suchanfrage bis zur Bewertung der Ergebnisse dargestellt.

1. Auswahl des Rechercheinstruments

Grundlegend für die Auswahl eines KI-gestützten Rechercheinstruments ist zunächst natürlich die gewünschte Funktion: Möchte man Quellen klassisch als Trefferliste ausgegeben bekommen, eine mit Referenzen versehene Volltextantwort erhalten oder ausgehend von einer einschlägigen Publikation weitere, durch Zitation oder Ähnlichkeit damit verknüpfte Texte finden? Diese verschiedenen Funktionsweisen einzelner Tools weisen schon auf einen zweiten wichtigen Aspekt hin: Was bedeutet „KI-gestützt“ für das jeweilige Angebot genau? Wird ein Ranking oder ein Volltextabgleich mit KI-Unterstützung erstellt oder basiert die Ausgabe einer ausformulierten Antwort in erster Linie auf textgenerativer KI? In letztem Fall: Welches Sprachmodell wird dafür genutzt? Die Beantwortung dieser Fragen ist nicht bei allen Anbietern einfach zu bewerkstelligen. Technische Details werden oft nur sehr oberflächlich oder gar nicht offengelegt. Vor der Nutzung eines online angebotenen Recherchetools sollte man sich daher auch über die Themen (fehlende) Transparenz und Datenschutz Gedanken machen: Ist nachvollziehbar, was mit eingegebenen Daten geschieht, wo sie verarbeitet und wie sie ggf. nachgenutzt werden? Die Eingabe von Daten beginnt bei vielen Anbietern schon mit einer für die vollumfängliche Nutzung benötigten, kostenfreien oder kostenpflichtigen Registrierung. Der Schwerpunkt dieses Erfahrungsberichts wird auf Rechercheinstrumenten liegen, die kostenfrei und idealerweise komplett ohne Registrierung nutzbar sind. Datenschutzrechtliche Bedenken schließt das aber nicht aus. Während für die Nutzung generativer KI-Modelle viele Hochschulen mit der GWDG KI-Cloud (Chat-AI, Voice-AI und Image-AI) verschiedene Modelle – häufig jedoch nicht in deren allerneuester Version – in einer geschützten Umgebung anbieten, laufen beim Thema KI-gestützte Recherche zwar unterschiedliche Entwicklungen parallelNeben hauseigenen Entwicklungen von Verlagen und Datenbankanbietern ist speziell für den Bibliotheksbereich das ebenso wie die GWDG KI-Cloud in Göttingen angesiedelte DFG-Projekt „LibraryAI – Explorative Entwicklung und Erprobung einer virtuellen Bibliotheksassistenten-Anwendung“ zu nennen,¹ ein fertig entwickeltes und gesichert DSGVO-konformes KI-Recherchetool ist mir aber bislang noch nicht bekannt.

Neben den genannten Aspekten ist es bei der Auswahl eines KI-gestützten Recherchetools zudem zentral, sich über die genutzte Datengrundlage zu informieren. Die große Mehrzahl der KI-gestützten Suchwerkzeuge greift auf die Datenbank von Semantic Scholar zurück. Andere von KI-gestützten Tools genutzte bibliographische Datenbanken sind u.a. Open Alex und Crossref. Da in diesen Quellen die Nachweise von – in der Mehrzahl englischsprachigen – Zeitschriftenartikeln sowie Open-Access-Publikationen überwiegen, bilden sie für viele geisteswissenschaftliche Fächer nicht das gesamte Spektrum relevanter Forschungsbeiträge ab. Als alleiniges Recherchewerkzeug erscheinen die KI-gestützten Suchinstrumente daher für Fächer wie die Romanistik bislang nicht ausreichend. Um die Anzahl passender Suchergebnisse zu erhöhen, kann die Wahl eines Recherchetools, das auf eine breitere Datenbasis zurückgreift, hilfreich sein. Im Bereich der Werkzeuge für Literaturnetzwerke kann somit zum Beispiel das Angebot von Inciteful, das neben Semantic Scholar, Open Alex und Crossref auch auf die Daten der Plattform Open Citations zugreift und zudem ohne Registrierung nutzbar ist, gegenüber dem vielleicht etwas bekannteren Angebot von ResearchRabbit punkten.² Dass eine möglichst breite Datenbasis alleine aber nicht ausreicht, sondern für ein wirklich gutes Angebot auch die möglichst niedrigschwellige Nutzbarkeit sowie die Fähigkeiten der eingebundenen KI-Modelle überzeugen müssen, zeigen einige Suchexperimente mit den Plattformen R Discovery von Editage und Asta des Allen Institute for Artificial Intelligence. Obwohl R Discovery im Vergleich zu Asta, das auf der Datenbasis von Semantic Scholar operiert,³ mit Crossref, Open Alex, Unpaywall, PubMed und Veröffentlichungen verschiedener Verlage⁴ auf eine diversere Datenbasis zurückgreift, erscheinen die Ergebnisse von Asta bei meinen Tests vielversprechender.

2. Formulierung der Suchanfrage

Während man in Bibliothekskatalogen und Fachdatenbanken Suchanfragen bisher in der Regel in Form von Stichwörtern formulieren muss und sie mit Hilfe Boolescher Operatoren verfeinern kann, nimmt die Mehrzahl der KI-gestützten Recherchetools auch Anfragen in Satz- oder Textform entgegen. Um gute Ergebnisse zu erzielen, tritt somit die Beherrschung der Syntax einer formalisierten Recherchesprache hinter Kenntnisse im Prompt-Engineering zurück. Für Fächer wie die Romanistik, in denen mehr als eine Wissenschaftssprache die Regel ist, hat zudem der Umgang der Systeme mit Mehrsprachigkeit eine hohe Relevanz. Stärken und Schwächen der Recherchewerkzeuge R Discovery und Asta treten schon im Rahmen einer kleinen, nicht repräsentativen Testreihe mit Suchanfragen in den Sprachen Deutsch, Englisch, Französisch, Italienisch und Spanisch zutage.

Der Bereich „Search Papers“ von R Discovery fordert zur Eingabe von „keyword, title or DOI“ auf, nimmt aber auch ausformulierte Suchanfragen entgegen. Anders als klassische Kataloge und Datenbanken, die in der Regel mit einer bevorzugten Such- und Erschließungssprache arbeiten, in der die verbale Inhaltserschließung der verzeichneten Dokumente erfolgt und durch die auch Publikationen in anderen Sprachen auffindbar gemacht werden, könnte man davon ausgehen, dass bei der KI-gestützten Auswertung von Eingaben die gewählte Sprache eine nachrangige Rolle spielt. Bei R Discovery ist dies jedoch nicht der Fall. Meine Testsuchen mit den Stichwörtern „Minderheitensprachen Rechte“, „Minderheitensprachen Rechte Spanien“ und „Frankreich Literatur Migration“ sowie deren wörtliche Übersetzungen in die oben genannten Sprachen liefern zwar alle am meisten englischsprachige Treffer, allerdings jeweils gefolgt von Treffern in der Sprache der Suchanfrage. Das kann man positiv als Orientierung der Suchergebnisse an den Interessen und Kenntnissen der suchenden Person bewerten, aber auch negativ, weil dadurch vermutlich der Recall leidet, also nicht die maximal mögliche Zahl der zur Suchanfrage passenden Quellen in der Datenbasis als Treffer ausgegeben wird. Die Ausgabe von bei allen Anfragen überwiegend englischsprachigen Publikationen dürfte einfach darauf zurückzuführen sein, dass diese wohl den größten Anteil der Datenbasis ausmachen. Insbesondere die deutschsprachigen Suchanfragen zeigen darüber hinaus Schwächen von R Discovery bei der Disambiguierung von Homonymen und der Zerlegung von Komposita auf. Bei der Suchanfrage „Minderheitensprache Rechte“ wird im Relevanzranking an dritter Stelle beispielsweise ein Treffer mit dem Titel „Rechte Gefühle“ angezeigt, der sich mit faschistischen Tendenzen der Gegenwart beschäftigt. Die Verwendung einer Pluralform in der Suche kann zwar kritisch hinterfragt werden. Andere Wege der Disambiguierung wie etwa der Rückgriff auf mit Homonymzusätzen versehene Normdaten finden bei R Discovery und anderen KI-gestützten Recherchetools bislang aber leider keine Anwendung. Um Minderheitensprachen geht es außerdem auch in den anderen am höchsten gerankten Treffern nicht. Das Kompositum scheint für das System ebenfalls eine Herausforderung darzustellen, denn bei den analogen Suchen nach „minority language rights“, „langue minoritaire droits“, „lingua minoritaria diritti“ und „lengua minoritaria derechos“ sind die Treffer mit der höchsten Relevanzbewertung besser passend. Der Bereich „Ask R Discovery“, bei dem eine Suche durch eine Volltextantwort mit Quellenverweisen beantwortet wird, erlaubt kostenfrei nur drei Anfragen ohne sowie drei weitere mit Registrierung und konnte daher nicht umfassend getestet werden.

Bei Asta wird die Suchanfrage immer zunächst automatisiert auf Englisch übersetzt und ihr semantischer Gehalt analysiert, woraufhin die offenbar maximal 75 relevantesten Treffer ermittelt und angezeigt werden. Die Ergebnisse sind dadurch unabhängig von der Sprache der Suchanfrage sehr ähnlich, allerdings überwiegt auch hier deutlich die Anzahl englischsprachiger Quellen, die in der Datenbank von Semantic Scholar die große Mehrzahl der Inhalte auszumachen scheinen. Auch der Bereich „Generate a report“ von Asta arbeitet mit einer Übersetzung der Suchanfrage ins Englische. Die darauf aufbauend erstellte Volltextantwort ist teils in der Sprache der Suche abgefasst, bei Anfragen auf Deutsch und Italienisch jedoch auf Englisch. Die verlinkten Quellen sind wiederum jeweils fast ausschließlich englischsprachig. Versuche, dies durch eine Erweiterung des Prompts um die Bitte nach Quellen in einer bestimmten Sprache zu ändern, bleiben erfolglos. Im Bereich „Find papers“, wo eine Suchanfrage mit einer reinen Trefferliste beantwortet wird, ist dies jedoch anders. Gibt man dort eine vollständige Frage als Suche ein und ergänzt sie um die Bitte, wissenschaftliche Artikel in einer bestimmten Sprache zu finden, funktioniert es gut, dass die Mehrzahl der Treffer in der genannten Sprache abgefasst ist und nur noch ein kleinerer Teil englischsprachiger Publikationen angezeigt wird. Als freies und unbegrenzt ohne Registrierung nutzbares Tool ist Asta zur Auswertung der Datenbank von Semantic Scholar nicht uninteressant. Für umfassende Recherchen erweist sich das Suchportal des FID Romanistik bislang aber als die ergiebigste Quelle für fachlich einschlägige Publikationen und sollte daher nicht durch die Nutzung KI-gestützter Recherchetools ersetzt werden. Wünschenswert und durchaus nicht unrealistisch ist zudem, dass die beiden Welten der wissenschaftlichen Recherche sich in den nächsten Jahren einander weiter annähern und bestehende Suchinstrumente mit von Bibliotheken kuratierten Metadaten um Recherchefunktionen mit KI-Unterstützung erweitert werden.

3. Bewertung der Ergebnisse

Die Beurteilung von Treffern hinsichtlich zentraler Kriterien wie Aktualität, Vertrauenswürdigkeit und Passgenauigkeit zum Thema der Recherche liegt natürlich auch bei bibliographischen Referenzen aus KI-unterstützten Suchen weiterhin im Zuständigkeitsbereich der anfragenden Person. Ebenso führt bei KI-generierten Volltextantworten kein Weg daran vorbei zu überprüfen, aus welchem Kontext Zitate ursprünglich stammen und ob sie von der KI adäquat wiedergegeben wurden.

Im Hinblick auf die ausgewertete Datenbasis erscheinen KI-gestützte Suchwerkzeuge für Literaturrecherchen in der Romanistik bislang nur als Ergänzung zu bestehenden Angeboten wie Bibliothekskatalogen, Fachdatenbanken und dem Suchportal des FID Romanistik empfehlenswert, etwa um gezielt die Datenbank von Semantic Scholar zu durchsuchen. Die bisherigen Erfahrungen zeigen darüber hinaus, dass auch mit zunehmender Integration von KI in Suchprozesse sowohl Recherche- als auch Fachkompetenzen unabdingbar bleiben, um brauchbare Ergebnisse zu erzielen und zu erkennen. Insofern erscheint eine enge Zusammenarbeit von Fachwissenschaft und Universitätsbibliotheken ideal, da die Sinnhaftigkeit von Recherchekompetenzen an fachlich konkret behandelten Themen am besten nachvollziehbar wird. Beim Formulieren von Prompts, aber auch bei der Auswertung KI-generierter Texte stellt ein kompetenter Umgang mit Sprache(n) und Text(en) einen großen Mehrwert dar. Philologische Disziplinen wie die Romanistik dürften vor dem Hintergrund textgenerativer KI-Systeme also gerade nicht ausgedient haben, sondern können neue Relevanz erlangen.

Bei allen Chancen, die KI-gestützte Prozesse heute und in Zukunft bieten können, sollten neben den in Bezug auf den Datenschutz bereits angesprochenen rechtlichen Aspekten auch ethische Fragen bei der Entscheidung für oder gegen die Nutzung eines KI-gestützten Instruments für bestimmte (Teil-)Aufgaben nicht unbeachtet bleiben. Ausbeuterische Strukturen beim Training von KI-Modellen oder negative Konsequenzen für die Umwelt infolge des sehr hohen Energieverbrauchs generativer KI-Anwendungen⁵ dürfen nicht als vermeintlich notwendiges Übel des technologischen Fortschritts hingenommen werden. Als User können wir durch unsere Wahl beispielsweise des genutzten Large Language Models mit darauf hinwirken, die Nachfrage nach KI-Produkten, welche unseren Wertvorstellungen nicht entsprechen, gering zu halten und Entscheidungsträger*innen in Politik und Wirtschaft dazu zu bewegen, die Rahmenbedingungen für KI-Anwendungen so zu gestalten, dass die Achtung fundamentaler Werte gewahrt bleibt.

Zitieren Sie diesen Artikel bitte so: Ursula Winter, "KI-gestützte Literaturrecherche in der Romanistik – ein Erfahrungsbericht", in Romanistik-Blog, 14. April 2026, https://blog.fid-romanistik.de/2026/04/14/ki-gestuetzte-literaturrecherche-in-der-romanistik-ein-erfahrungsbericht/.

1
Vgl. https://gepris.dfg.de/gepris/projekt/559325635 (9.4.2026).
2
Die Informationen zu den Datenquellen sind folgenden Webseiten entnommen: https://incitefulmed.com/academic/data (9.4.2026) und https://learn.researchrabbit.ai/en/articles/13158099-using-researchrabbit-alongside-library-databases (9.4.2026).
3
Vgl. Ken Yeung: „Ai2’s Asta Launches as an Open Framework to Bring Rigor to Scientific AI“, 26.8.2025, https://thelettertwo.com/2025/08/26/ai2-asta-open-science-ai-framework/ (9.4.2026).
4
Vgl. https://discovery.researcher.life/ (9.4.2026).
5
Vgl. Argie Kasprzik: „Die KI(rche) im Dorf lassen. Plädoyer für eine klima- und sozialverträgliche Nutzung von Künstlicher Intelligenz“, in: o-bib 12/4 (2025), https://doi.org/10.5282/o-bib/6201 (9.4.2026).

KI-gestützte Literaturrecherche in der Romanistik – ein Erfahrungsbericht

1. Auswahl des Rechercheinstruments

2. Formulierung der Suchanfrage

3. Bewertung der Ergebnisse

Ähnliche Beiträge

Schreibe einen Kommentar

1. Auswahl des Rechercheinstruments

2. Formulierung der Suchanfrage

3. Bewertung der Ergebnisse

Teilen auf:

Ähnliche Beiträge

Schreibe einen Kommentar