Das private Palantir: Wenn öffentliche Daten zu Dossiers werden

Benjamin Metzig
vor 2 Stunden
8 Min. Lesezeit

Wissenschaftswelle-Cover mit gelber Überschrift Das private Palantir, rotem Banner und einem Papierstapel, aus dem ein transparentes Datenprofil aufsteigt.

Das private Palantir beginnt mit einer unbequemen Verschiebung: Manche gesellschaftlichen Risiken entstehen nicht durch einen plötzlichen Skandal, sondern dadurch, dass etwas, das bisher mühsam war, plötzlich billig wird.

Genau darum geht es in meinem neuen Forschungsdossier:

Das private Palantir.

Öffentliche Daten waren nie automatisch harmlos. Aber lange waren sie oft verstreut, kontextgebunden, alt, unvollständig, schwer zu finden oder nur mit erheblichem Aufwand sinnvoll zu verknüpfen. Diese Reibung war ein stiller Schutz. KI-Agenten, lange Kontextfenster, Dokumentenanalyse, Webrecherche, Speicher und offene Modelle greifen genau diese Reibung an.

Kernaussagen

Die Studie behauptet nicht, dass totale private Überwachung bereits Alltag ist. Sie zeigt ein plausibles, schnell näher rückendes Risikomuster.
Öffentliche Information ist nicht automatisch beliebig nutzbare Information. Viel Privatsphäre beruht auf praktischer Obskurität: Zerstreuung, Aufwand, Kontext und Vergessen.
KI-Agenten senken die Kosten, verstreute öffentliche Spuren zu wiederholbaren privaten Dossiers zu verbinden.
Eine Pilotstudie mit 125 kommunalen PDFs aus Heidelberg, Mannheim, Leipzig, Frankfurt am Main und Nürnberg zeigt: Serielle Veröffentlichungen können dauerhaft maschinenlesbare Aggregationsinputs erzeugen.
Die Antwort ist nicht Geheimhaltung um jeden Preis, sondern bessere Veröffentlichungsgovernance: weniger unnötige personenbezogene Kontaktdaten, bereinigte Metadaten, Rollenkontakte, Review-Prozesse und besondere Vorsicht bei Schul-, Jugend- und Familienkontexten.

Studienpaket zum Download

Das deutschsprachige Dossier (nur Kurzfassung) liegt hier als PDF vor:

Für internationale Leserinnen, Journalisten und Forschende sind zusätzlich englische Fassungen (vollständige Fassung) verfügbar:

Empfohlene Zitierweise: Metzig, B. (2026). Das private Palantir: Forschungsbericht über KI-Agenten, öffentliche Daten und das Ende praktischer Obskurität. Wissenschaftswelle.de.

Der Satz, der hängen bleiben sollte

Die politische Kernfrage lautet nicht mehr nur: Welche Daten sind öffentlich? Sie lautet: Wer darf öffentliche Spuren automatisch verbinden, bewerten, speichern und gegen Menschen verwenden?

Dieser Satz ist der Grund, warum das Thema Aufmerksamkeit verdient. Er verschiebt die Debatte weg von einer bequemen Entweder-oder-Frage. Es geht nicht um Geheimhaltung gegen Transparenz. Es geht auch nicht darum, öffentliche Dokumente pauschal zu verdächtigen. Es geht um eine neue technische Lage: Was früher nur mit Geduld, Ortskenntnis, sozialer Nähe oder erheblichem Suchaufwand möglich war, kann durch agentische Systeme schrittweise automatisierbar werden.

Das berührt dieselbe Freiheitsfrage, die ich im Beitrag Datenschutz als Freiheitsfrage beschrieben habe: Privatsphäre ist nicht bloß das Verstecken von Geheimnissen. Sie ist die Möglichkeit, in unterschiedlichen Kontexten nicht immer mit der Summe aller eigenen Spuren konfrontiert zu werden.

Was neu ist: nicht die Daten, sondern die Reibung

Viele Informationen über Menschen sind öffentlich, weil Gesellschaft ohne Öffentlichkeit nicht funktioniert. Amtsblätter nennen Zuständigkeiten. Vereine veröffentlichen Ansprechpartner. Schulen, Kommunen, Kulturinstitutionen, Unternehmen und Verwaltungen stellen Programme, Protokolle, Termine, Fotos, Kontaktdaten oder PDFs bereit. Das ist nicht automatisch falsch. Oft ist es demokratisch, praktisch und notwendig.

Der Bruch entsteht, wenn die Schutzschicht zwischen Veröffentlichung und Profilierung dünner wird. Diese Schutzschicht heißt im Dossier praktische Obskurität. Eine Information kann öffentlich sein und trotzdem funktional geschützt bleiben, weil sie verstreut ist, Kontext braucht, veraltet, mehrdeutig oder schwer mit anderen Informationen zu verbinden ist.

KI-Agenten verändern diese Kostenstruktur. Sie können Suchaufträge zerlegen, Dokumente lesen, Tabellen erkennen, Bilder auswerten, Browser bedienen, Zwischenergebnisse speichern und wiederholt dieselbe Person, Rolle oder Institution beobachten. Der EDPB weist in seiner Opinion 28/2024 darauf hin, wie eng KI-Modelle mit Fragen von Transparenz, Rechtsgrundlage, Datenminimierung und Verarbeitung öffentlich zugänglicher Quellen verbunden sind. Der EU AI Act ordnet KI zwar risikobasiert, aber viele private, informelle und lokale Formen der Profilierung fallen gerade nicht sauber in die öffentliche Vorstellung großer Hochrisikosysteme.

Die Gefahr liegt also nicht in einem magischen Supermodell. Sie liegt in der Kopplung vieler kleiner Fähigkeiten: Suche, Verknüpfung, Speicher, Wiederholung, Mustererkennung und sinkende Kosten.

Warum falsche Profile trotzdem gefährlich sind

Ein häufiger Einwand lautet: KI macht Fehler. Das stimmt. Aber für viele Schäden braucht es kein perfektes Profil.

Ein selektives Dossier kann reichen, um jemanden einzuschüchtern. Ein falscher Zusammenhang kann reichen, um Misstrauen zu säen. Ein halbgares Arbeitgeber-Screening kann reichen, damit eine Bewerbung leiser aussortiert wird. Ein Doxxing-Versuch muss nicht wissenschaftlich sauber sein, um gefährlich zu werden. Betrug, Stalking, politische Einschüchterung und lokale Konflikte arbeiten nicht nach Peer-Review-Standards.

Genau deshalb sind die aktuellen Sicherheitsberichte relevant. Europol beschreibt im IOCTA 2025, wie stark Cyberkriminalität um gestohlene Daten, Social Engineering und die Ausbeutung menschlicher Schwächen kreist. Das BKA schreibt im Bundeslagebild Cybercrime 2025, dass KI-basierte Werkzeuge in der Cyberbedrohungslage an Bedeutung gewinnen. Mein Dossier überträgt diese Logik auf ein angrenzendes Feld: nicht nur illegale Daten, sondern auch legal sichtbare, aber bisher schwer rekombinierbare öffentliche Spuren.

Das ist auch der Anschluss an den Wissenschaftswelle-Beitrag über Datenhandel mit verletzlichen Gruppen. Dort geht es um Märkte und Zielprofile. Hier geht es um die Frage, wie niedrig die Schwelle wird, wenn private Akteure ihre eigenen kleinen Dossiers bauen können.

Wo das im Alltag kippen kann

Die abstrakte Formel klingt zunächst technisch: öffentliche Spuren werden leichter aggregierbar. Konkret bedeutet sie aber, dass Menschen in Situationen geraten können, in denen Informationen aus verschiedenen Lebensbereichen plötzlich gemeinsam gegen sie arbeiten.

Bewerbung und informelles Screening: Eine Person bewirbt sich bei einem lokalen Arbeitgeber. Ein KI-gestützter Recherchelauf findet Vereinsfunktionen, politische Wortmeldungen, alte Veranstaltungsprogramme, Kontaktdaten in kommunalen PDFs und vielleicht ein Foto aus einem Schul- oder Elternkontext. Nichts davon muss geheim gewesen sein. Problematisch wird die Zusammenführung: Aus einzelnen öffentlichen Rollen entsteht ein privates Bild, das nie zur Bewertung einer Bewerbung gedacht war.
Trennung, Stalking und digitale Gewalt: Wer jemanden einschüchtern will, braucht nicht zwingend Zugang zu gehackten Daten. Schon Adressenfragmente, Funktionsmails, Vereinsseiten, Sitzungsprotokolle, Fotos, Termine und familiäre Kontexte können reichen, um Nähe zu erzeugen, Drohungen glaubwürdiger wirken zu lassen oder Betroffene zum Rückzug aus Öffentlichkeit zu zwingen.
Kommunalpolitik und Ehrenamt: Lokal engagierte Menschen sind oft sichtbar, aber nicht prominent genug, um professionellen Schutz zu haben. Wenn frühere Ausschussunterlagen, Amtsblätter, Vereinsprogramme und Social-Media-Spuren leichter zusammenlaufen, kann aus demokratischer Sichtbarkeit eine Angriffsfläche werden: für Kampagnen, private Fehden, Einschüchterung oder gezielte Rufschädigung.
Schule, Jugend und Familie: Auch wenn einzelne Kinder nicht direkt genannt werden, können Begriffe, Rollen, Termine, Einrichtungen, Elternfunktionen und Kontaktmuster sensible Kontexte markieren. Das Risiko liegt nicht nur in der einzelnen Veröffentlichung, sondern in der Möglichkeit, über Jahre hinweg institutionelle Spuren zusammenzuziehen.
Betrug und Social Engineering: Ein glaubwürdiger Betrugsversuch lebt von Details. Wer Rolle, Zuständigkeit, Kollegenkreis, Kommune, Verein, Schule oder frühere Projekte kennt, kann E-Mails, Anrufe und Nachrichten persönlicher machen. KI muss dafür nicht perfekt sein; sie muss nur genug passende Anknüpfungspunkte liefern.

Das Gemeinsame an diesen Szenarien ist nicht die große Überwachungsmaschine. Es ist die kleine, wiederholbare Recherche, die plötzlich für sehr viele Akteure erschwinglich wird. Genau das macht die Entwicklung so schwer zu sehen: Sie sieht nicht aus wie ein Skandal, sondern wie viele einzelne Fälle, in denen Menschen sich wundern, warum jemand so viel über sie weiß.

Warum die nächsten Jahre heikler werden

Heute sind KI-Agenten noch fehleranfällig. Sie halluzinieren, übersehen Kontext, verwechseln Personen und scheitern an Webseiten. Das ist ein realer Dämpfer. Aber für die Risikobewertung reicht es nicht, nur auf perfekte Automatisierung zu schauen. Viele problematische Nutzungen brauchen keinen fehlerfreien Agenten, sondern nur eine billigere erste Sammlung, bessere Suchvorschläge und eine schnellere Verdichtung.

Kurzfristig wird vor allem die Vorarbeit billiger: Dokumente herunterladen, PDFs durchsuchen, Namen und Rollen erkennen, Kontaktmuster markieren, öffentliche Quellen sortieren. Mittelfristig wird daraus eher ein Beobachtungsproblem: Agenten könnten wiederkehrend prüfen, ob neue Amtsblätter, Vereinsseiten, Fotos, Ausschreibungen oder Protokolle erschienen sind. Aus einer einmaligen Suche wird dann ein stilles Monitoring.

Langfristig verschiebt sich die Machtfrage noch einmal. Multimodale Modelle können nicht nur Text, sondern auch Bilder, Screenshots, Tabellen und Scans einbeziehen. Offene und lokal ausführbare Modelle senken die Kontrolle über Missbrauch, weil nicht jede problematische Nutzung über große Plattformen läuft. Datenbroker, alte Archive und öffentliche Register könnten mit privaten Sammlungen zusammenwachsen. Dann wird praktische Obskurität nicht auf einmal abgeschafft, sondern Stück für Stück ausgehöhlt.

Gerade deshalb ist jetzt der richtige Zeitpunkt für Gegenmaßnahmen. Noch geht es nicht darum, ein fertiges Massenphänomen zu verwalten. Es geht darum, Veröffentlichungsroutinen zu verändern, bevor die Kombination aus Archiv, Agent und privatem Motiv normal wird.

Was das Fünf-Städte-Audit zeigt

Das begleitende Fünf-Städte-Audit untersucht 125 öffentliche kommunale PDF-Publikationen aus Heidelberg, Mannheim, Leipzig, Frankfurt am Main und Nürnberg. Jede Stadt steuerte 25 live-validierte serielle PDFs bei. Die Studie hat keine Personen verfolgt, keine Namen gespeichert, keine Rohtexte veröffentlicht und keine personenbezogenen Dossiers erzeugt. Untersucht wurden dokumentbezogene Aggregatindikatoren.

Die Ergebnisse sind deshalb bewusst schmal, aber wichtig. Alle 125 Dokumente wurden erfolgreich verarbeitet. Alle enthielten E-Mail- und Telefonnummernmuster. 79 enthielten PDF-Autorenmetadaten. Der mittlere Aggregierbarkeitsscore lag bei 8,92; 48 Dokumente wurden als hoch und 77 als sehr hoch eingestuft. Der Datenanhang dokumentiert Quellenliste, Korpuszusammenfassung und aggregierte Indikatoren, ohne Roh-PDFs, Rohtexte, Namen oder personenbezogene Datensätze bereitzustellen.

Das beweist keine Rechtswidrigkeit. Es beweist keinen Missbrauch. Es zeigt etwas Nüchterneres: Routinemäßige kommunale Veröffentlichung kann dauerhafte, vergleichbare und maschinenlesbare Inputs für spätere Aggregation erzeugen.

Wer über digitale Verwaltung spricht, muss deshalb nicht nur fragen, ob ein Prozess online funktioniert. Er muss auch fragen, welche Spuren ein funktionierender Prozess dauerhaft hinterlässt.

Was die Studie ausdrücklich nicht behauptet

Diese Grenze ist entscheidend, weil Aufmerksamkeit ohne Genauigkeit schnell in Panik kippt.

Das Dossier behauptet nicht, dass umfassende private Überwachung bereits überall stattfindet. Es behauptet nicht, dass kommunale Veröffentlichungen an sich falsch sind. Es behauptet nicht, dass KI-Agenten heute zuverlässig jede Rechercheaufgabe lösen. Es behauptet auch nicht, dass das Fünf-Städte-Audit repräsentativ für alle deutschen Institutionen ist.

Die belastbare Aussage ist enger: Die technischen, organisatorischen und ökonomischen Bedingungen für gezielte automatisierte Personenprofilierung aus öffentlichen Daten verbessern sich schnell. Dadurch sinkt die Schwelle für Stalking, Doxxing, Einschüchterung, Betrug, informelles Arbeitgeber-Screening und lokale Formen sozialer Macht.

Diese Begrenzung macht die Warnung stärker, nicht schwächer. Sie verhindert den Reflex, das Thema als Science-Fiction abzutun.

Was jetzt auf die Agenda gehört

Erstens: Wiederholte personenbezogene Aggregation sollte als eigenständiges Risikomuster benannt werden. Datenschutzrecht kennt Profiling, Zweckbindung und Datenminimierung. Die öffentliche Debatte braucht zusätzlich eine verständliche Sprache für die wiederholte private Zusammenführung öffentlicher Spuren.

Zweitens: Institutionen sollten veröffentlichte PDFs, Archive, Amtsblätter, Veranstaltungsprogramme und Kontaktseiten nicht nur auf rechtliche Mindestanforderungen prüfen, sondern auf langfristige Aggregierbarkeit. Gerade in Schul-, Jugend-, Familien- und Ehrenamtskontexten kann Sichtbarkeit wichtig sein, aber sie braucht Grenzen.

Drittens: Rollenkontakte sollten personenbezogene Kontaktdaten ersetzen, wo das organisatorisch möglich ist. Eine Funktionsadresse schützt nicht alles, aber sie reduziert die dauerhafte Verknüpfung einer Person mit Rolle, Ort, Zeit und Thema.

Viertens: PDF-Metadaten gehören vor Veröffentlichung bereinigt. Das klingt klein, ist aber genau die Art unspektakulärer Schutzmaßnahme, die in der Masse wirkt.

Fünftens: Archive brauchen Review- und Retention-Prozesse. Nicht jedes Dokument, das einmal sinnvoll öffentlich war, muss für immer im gleichen Kontext auffindbar bleiben.

Sechstens: KI-Anbieter und Plattformen sollten wiederholte personenbezogene Aggregation als Missbrauchssignal behandeln. Wenn ein System nicht nur eine Information sucht, sondern viele Spuren über eine identifizierbare Person zusammenführt, ist das qualitativ etwas anderes.

Siebtens: Forschung muss das Feld messbar machen, ohne Schaden zu reproduzieren. Der methodische Anspruch ähnelt dem Problem, das ich bei KI-Audits beschrieben habe: Ein Prüfbericht ist kein Entwarnungssiegel. Entscheidend ist, ob er reale Risiken sichtbar macht, ohne sie selbst zu verstärken.

Warum Öffentlichkeit jetzt zählt

Das private Palantir ist als Begriff zugespitzt, aber die These dahinter ist nüchtern. Es geht nicht um eine einzelne Firma, ein einzelnes Produkt oder einen einzelnen Skandal. Es geht um die Möglichkeit, dass immer mehr private Akteure Funktionen nutzen können, die früher spezialisiertes Wissen, Zeit, Geld oder institutionelle Macht verlangten.

Wenn diese Entwicklung erst dann politisch ernst genommen wird, wenn konkrete Schäden sichtbar sind, ist die Schutzschicht bereits dünner geworden. Besser ist eine frühere Debatte: Welche öffentlichen Spuren brauchen wir? Welche Veröffentlichungen sind demokratisch notwendig? Welche Metadaten sind überflüssig? Welche Archive müssen zugänglich bleiben, aber kontextualisiert werden? Welche Personengruppen brauchen besonderen Schutz? Und wo wird aus Transparenz unbeabsichtigtes Rohmaterial für private Macht?

Das Dossier ist deshalb eine Einladung zur Debatte, nicht ihr Abschluss. Es soll von Journalistinnen, Datenschutzbeauftragten, Kommunen, Forschenden, zivilgesellschaftlichen Beratungsstellen und politischen Entscheidungsträgern geprüft, kritisiert und weiterentwickelt werden.

Die entscheidende Einsicht ist einfach: Öffentlichkeit braucht Regeln für das Zeitalter der Aggregation. Eine demokratische Gesellschaft muss nicht weniger offen werden. Sie muss klüger unterscheiden, welche Spuren sie dauerhaft, maschinenlesbar und rekombinierbar macht.

Autorenprofil

Benjamin Metzig ist Gründer, Autor und redaktionell Verantwortlicher von Wissenschaftswelle.de. Wissenschaftswelle ist ein persönlich geführtes redaktionelles Wissensprojekt, das komplexe Themen aus unterschiedlichen Fachbereichen sorgfältig recherchiert, strukturiert und verständlich aufbereitet. Moderne Recherche-, Analyse- und KI-Werkzeuge dienen dabei als Unterstützung, während Auswahl, Einordnung, Ton, Quellenbewertung und Veröffentlichung redaktionell bei Benjamin Metzig verantwortet bleiben. Mehr zum Profil: Autorenprofil von Benjamin Metzig.

Instagram Facebook