KI in der Geschichtsforschung: Der Scan ist noch keine Quelle

Benjamin Metzig
19. Mai
6 Min. Lesezeit

Ein altes Archivbuch wird von einem hellen Scanstrahl erfasst, aus dem sich vor dunklen Regalen ein leuchtendes Netzwerk aus Namen und Verbindungslinien erhebt.

Wer heute über eine Handelsstadt, eine Glaubensbewegung oder einen politischen Umbruch forscht, beginnt oft nicht mehr im Lesesaal, sondern im Suchfeld. Millionen Seiten sind digitalisiert, Register lassen sich durchsuchen, Namen clustern, Korrespondenzen verknüpfen. Genau dort setzt KI in der Geschichtsforschung an: nicht erst bei der großen Deutung, sondern viel früher, in der Frage, was aus handschriftlichen, gedruckten oder beschädigten Quellen überhaupt maschinenlesbar wird.

Das verändert historische Arbeit tiefgreifend. Es macht sie schneller, breiter und oft überraschender. Es verschiebt aber auch den Ort der Quellenkritik. Historiker müssen nicht nur fragen, wer ein Dokument geschrieben hat und in welchem Kontext es entstand. Sie müssen zusätzlich verstehen, wie eine Quelle gescannt, transkribiert, segmentiert, verschlagwortet und in Datenmodelle übersetzt wurde. Die eigentliche Pointe lautet deshalb nicht, dass KI Geschichte übernimmt. Spannender ist, dass sie den Weg zur historischen Frage neu formt.

Der Umbruch beginnt vor der Interpretation

Massendigitalisierung klingt zunächst nach einer reinen Komfortfrage. Mehr Material ist online, also wird Forschung einfacher. Doch schon die American Historical Association hat in ihrem Beitrag Googling History darauf hingewiesen, dass Historiker im digitalen Raum nicht einfach Quellen finden, die vorher schon neutral da waren. Sie finden das, was digitalisiert, indexiert und von Suchsystemen auffindbar gemacht wurde.

Damit verschiebt sich der Horizont der Fragen. Wer in digitalisierten Beständen sucht, arbeitet oft mit dem Bestand, der technisch bearbeitbar, urheberrechtlich verfügbar oder institutionell priorisiert wurde. Was nicht gescannt wurde, schlecht erschlossen ist oder hinter anderen Suchlogiken verschwindet, erscheint leicht wie eine historische Leerstelle, obwohl es in Wahrheit nur eine digitale ist. Harry Smith und Emily Vine zeigen in ihrer Studie zu materiellen und digitalen Archiven, dass digitale Surrogate nicht bloß Kopien sind. Sie sind bereits Resultate aus Auswahl, Interface-Design, Metadaten und medientechnischer Vereinfachung.

Gerade für ein Thema wie Geschichte ist das folgenreich. Ein Archivkarton widersetzt sich dem schnellen Überblick. Eine Suchmaske tut das nicht. Sie erzeugt die nützliche Illusion, dass die Vergangenheit bereits in diskrete Treffer zerlegt vorliegt. Wer mit historischen Quellen arbeitet, bewegt sich deshalb heute oft in zwei Archiven zugleich: im materiellen und im digitalen. Warum diese materielle Seite nicht bloß nostalgischer Rest ist, zeigt auch der Wissenschaftswelle-Beitrag zu religiösen Archiven, in dem die Eigenlogik von Kisten, Registern und Überlieferungsbrüchen selbst Teil der Erkenntnis wird.

Wenn Seiten zu Daten werden

Der eigentliche KI-Gewinn beginnt dort, wo große Bestände nicht nur gescannt, sondern in bearbeitbare Daten verwandelt werden. Handschriftenerkennung, OCR, automatische Segmentierung, Entitätenerkennung oder thematische Klassifikation helfen, Materialmengen zu strukturieren, die für einzelne Forscher sonst kaum überblickbar wären. Das ist keine Kleinigkeit. Wer hunderttausende Zeitungsseiten oder Verwaltungsakten auswerten will, braucht Vorfilter, Mustererkennung und maschinelle Hilfe.

Doch jeder dieser Schritte hat eine historische Schlagseite. Jon Coburn beschreibt in seiner Studie über digitale Selektivität, wie schnell die Benutzung digitaler Sammlungen darüber hinwegtäuscht, dass OCR-Fehler, lückenhafte Metadaten und uneinheitliche Erfassungsregeln selbst Teil des Forschungsproblems sind. Frakturschrift, verblasste Tinte, Randnotizen oder beschädigte Seiten sind für Menschen oft mühsam, für Modelle aber nicht selten systematisch verzerrend. Was als sauber extrahierter Personenname erscheint, kann in Wirklichkeit das Produkt einer fehlerhaften Texterkennung sein. Was als zusammenhängendes Dokument wirkt, war vielleicht im Original ein Bündel loser, unterschiedlich datierter Fragmente.

Genau deshalb ist die digitale Vorverarbeitung keine neutrale Fleißarbeit. Sie entscheidet mit darüber, welche Muster später statistisch auffällig werden. Das ist historisch besonders heikel, weil kleine Varianten oft große Bedeutung tragen. Ein einziger nachträglich eingefügter Vermerk, eine gestrichene Formulierung oder eine Verschiebung in der Reihenfolge kann einen Quellenbefund neu rahmen. Wer dafür ein Gespür bekommen will, findet in Bevor der Satz stillsteht: Wie Textgenetik Literatur beim Entstehen zeigt eine gute Parallelperspektive: Gerade die Übergänge, Varianten und Überarbeitungen sind oft erkenntnistragender als die glatte Endfassung.

Hinweis: In digitaler Geschichtsforschung ist eine Quelle nie nur Ursprung.

Sie ist fast immer auch das Ergebnis technischer Zwischenschritte: Scan, OCR, Metadaten, Datenmodell, Suchindex.

Netzwerke können Beziehungen zeigen, aber sie erklären sie nicht

Sobald Quellen in strukturierte Daten übersetzt sind, eröffnet KI in der Geschichtsforschung eine zweite Stärke: Sie kann Beziehungen sichtbar machen, die in Einzellektüre kaum auffallen. Korrespondenznetzwerke, Handelsverflechtungen, Patronageketten oder Verwaltungslinien lassen sich kartieren, vergleichen und zeitlich verdichten. Werkzeuge wie Palladio sind genau für diese reflektierte Arbeit mit fragmentarischen historischen Daten gebaut worden. Sie behandeln Netzwerke nicht als Wahrheitsspiegel, sondern als heuristisches Medium.

Wie produktiv das sein kann, zeigt das Stanford-Projekt Charting the Ottoman Empire. Dort werden osmanische Gerichts- und Finanzquellen so modelliert, dass Beziehungen zwischen Akteuren, Krediten, Orten und Institutionen analysierbar werden. Gerade darin liegt der Reiz: Nicht ein einzelnes Dokument liefert die Pointe, sondern eine relationale Struktur, die Verbindungen zwischen Fällen sichtbar macht, die im Archiv physisch weit auseinanderliegen.

Aber ein Netzwerk ist noch keine Erklärung. Eine Kante im Graphen sagt nicht, ob eine Beziehung stabil, konfliktgeladen, zufällig oder nur administrativ ist. Ein Cluster zeigt Nähe, aber noch keine geteilte Weltdeutung. Wer das vergisst, verwechselt Visualisierung mit Interpretation. Der Wissenschaftswelle-Text Die Macht sitzt oft auf der Brücke: Wie Netzwerkanalyse Gruppen wirklich lesbar macht macht genau diesen Punkt stark: Netzwerke helfen beim Denken, sie erledigen es nicht.

Für Historiker ist das besonders wichtig, weil Beziehungen in Quellen häufig asymmetrisch überliefert sind. Eliten hinterlassen mehr Schrift als Randgruppen. Institutionen archivieren anders als Familien. Koloniale Verwaltungen dokumentieren andere Beziehungen als die Menschen, über die sie herrschen. Eine saubere Netzwerkdarstellung kann also hoch aufschlussreich sein und zugleich eine sehr schräge soziale Optik reproduzieren.

Quellenkritik wird durch KI nicht kleiner, sondern härter

Der klassische Werkzeugkasten der Geschichtswissenschaft bleibt deshalb erhalten, nur sein Einsatzpunkt wandert nach vorn. Früher begann die skeptische Frage oft am einzelnen Dokument. Heute beginnt sie oft schon beim Datensatz. Wer hat den Bestand zusammengestellt? Welche Regionen sind überrepräsentiert? Welche Jahrgänge fehlen? Wurden Bildseiten und Beilagen gleich behandelt? Welche Entitäten kann das Modell gut erkennen und welche nicht?

Wie ernst dieses Problem ist, zeigt die Studie Whose news? aus dem Feld der historischen Datensatzkritik. Der Kernbefund ist unbequem: Große Korpora sehen schnell vollständig aus, obwohl sie durch Auswahlentscheidungen, Lizenzlagen, Überlieferungslücken und technische Aufbereitung schief gebaut sind. Wer dann mit KI Muster extrahiert, verstärkt diese Schieflagen nicht selten nur mit größerer Rechengeschwindigkeit. Eine Chat-Oberfläche kann daraus am Ende scheinbar mühelos erklären, wie sich „die öffentliche Meinung“ entwickelt habe, obwohl im Hintergrund vielleicht vor allem urbane, gut erhaltene und gut gescannte Zeitungstitel sprechen.

An dieser Stelle wird das Wort „anachronistisch“ praktisch. Modelle erkennen Muster aus gegenwärtigen Klassifikationen. Historische Quellen folgen aber oft anderen Begriffswelten, Kategorien und administrativen Routinen. Eine KI kann also sehr elegant Ordnungen rekonstruieren, die eher in unsere heutige Analyse passen als in die damalige Lebenswirklichkeit. Ein Begriff wie „Beruf“, „Ethnie“, „Öffentlichkeit“ oder sogar „Autorenschaft“ hatte je nach Epoche und Quellensorte andere Konturen. Wenn ein Modell solche Felder zu sauber vereinheitlicht, gewinnt man schnell Ordnung im Datensatz, verliert aber Reibung an der Quelle. Gute Geschichtsforschung muss deshalb immer mitdenken, ob ein maschinell stabilisiertes Muster historisch plausibel ist oder nur modern sauber aussieht.

Diese Verschiebung macht die Arbeit nicht altmodischer, sondern anspruchsvoller. Historiker brauchen heute Quellenkritik für Texte und Metadaten, für Interface-Logiken und Trainingsdaten, für Suchergebnisse und Visualisierungen. Die Frage lautet nicht mehr nur: Ist diese Quelle glaubwürdig? Sie lautet auch: Welche technischen Schichten haben aus ihr genau die Quelle gemacht, die ich gerade vor mir sehe?

Die Verführung der glatten Antwort

Mit generativen KI-Systemen kommt eine neue Versuchung hinzu. Archive lassen sich inzwischen über Chat-Oberflächen, Retrieval-Systeme und KI-Assistenten ansprechen. Das ist faszinierend, weil es Einstiegshürden senkt. Es ist aber auch riskant. Der Beitrag AI assistants in the archive and the lure of “instant history” beschreibt präzise, warum diese Systeme zu glatten Erzählungen verleiten: Sie übersetzen unübersichtliche Überlieferung in sprachlich souveräne Antworten, ohne dass die Materialität, Lückenhaftigkeit und Streitigkeit der Quellen im selben Maß sichtbar bleiben.

Gerade darin liegt die eigentliche Gefahr anachronistischer Muster. Ein Sprachmodell formuliert nicht nur Ergebnisse, es nivelliert Unsicherheit. Mehrdeutige Überlieferung, konkurrierende Deutungen und brüchige Terminologien lassen sich in wenigen Sätzen erstaunlich elegant überschreiben. Was dann wie historische Sicherheit klingt, kann in Wahrheit ein gut verpackter Durchschnitt aus Trainingsdaten, Retrieval-Treffern und probabilistischer Glättung sein.

Darum braucht KI in der Geschichtsforschung dieselbe Transparenzkultur, die in anderen Anwendungsfeldern längst eingefordert wird. Der Wissenschaftswelle-Beitrag Vertrauen braucht Beipackzettel liefert dafür eine naheliegende Brücke: Auch historische KI-Werkzeuge sollten offenlegen, mit welchen Beständen, Segmentierungen, Fehlerquoten und Annahmen sie arbeiten. Und der Text Wenn Maschinen Wissenschaft erzählen erinnert daran, dass sprachliche Eleganz kein Ersatz für prüfbare Herleitung ist.

Was an KI in der Geschichtsforschung wirklich neu ist

Das Neue an KI in der Geschichtsforschung ist am Ende nicht, dass Maschinen plötzlich Geschichte „verstehen“. Neu ist vielmehr die Größenordnung, in der historische Spuren in Daten verwandelt, verglichen und neu kombiniert werden können. Historiker können schneller in Breitenbeständen arbeiten, abgelegene Verbindungen entdecken und Fragen an Material richten, das früher zu groß oder zu verstreut war.

Aber genau derselbe Fortschritt macht die Vermittlungsschichten wichtiger als zuvor. Wer mit KI historische Forschung betreibt, darf Suchmaschinen, OCR-Pipelines, Entitätenmodelle und Chat-Interfaces nicht als bloße Hilfswerkzeuge behandeln. Sie sind Teil des Erkenntnisapparats. Sie formen mit, was sichtbar, zählbar und erzählbar wird.

Geschichte bleibt deshalb auch im Zeitalter von KI eine Streitkunst der Belege. Der produktivste Einsatz beginnt dort, wo Modelle nicht an die Stelle der Quellenkritik treten, sondern sie auf neue Ebenen zwingen. Der Scan ist noch keine Quelle. Und ein Muster ist noch kein historischer Befund, solange nicht geklärt ist, wie es zustande kam.

Autorenprofil

Benjamin Metzig ist Gründer, Autor und redaktionell Verantwortlicher von Wissenschaftswelle.de. Wissenschaftswelle ist ein persönlich geführtes redaktionelles Wissensprojekt, das komplexe Themen aus unterschiedlichen Fachbereichen sorgfältig recherchiert, strukturiert und verständlich aufbereitet. Moderne Recherche-, Analyse- und KI-Werkzeuge dienen dabei als Unterstützung, während Auswahl, Einordnung, Ton, Quellenbewertung und Veröffentlichung redaktionell bei Benjamin Metzig verantwortet bleiben. Mehr zum Profil: Autorenprofil von Benjamin Metzig.

Instagram

Facebook