Wissenschaftliche Meldungen
KI schlägt durchschnittliche Menschen in Kreativitätstests – doch menschliche Spitzenleistungen bleiben unerreicht
22.1.26, 16:35
Technologie, Künstliche Intelligenz, Soziologie

Wenn Maschinen kreativ wirken
Kreativität gilt als eine der letzten Bastionen menschlicher Intelligenz. Doch eine aktuelle Studie aus Kanada stellt dieses Selbstbild teilweise infrage: Künstliche Intelligenz kann in standardisierten Kreativitätstests inzwischen besser abschneiden als der durchschnittliche Mensch. Gleichzeitig zeigt die Untersuchung aber auch klare Grenzen auf – denn besonders kreative Menschen bleiben der Maschine weiterhin überlegen.
Die Forschungsarbeit stammt von einem interdisziplinären Team um den Neurowissenschaftler Karim Jerbi an der University of Montreal und wurde im Januar 2026 in der Fachzeitschrift Scientific Reports veröffentlicht. Ziel war es, menschliche und maschinelle Kreativität erstmals in großem Maßstab direkt miteinander zu vergleichen.
Ein einfacher Test für ein komplexes Konzept
Gemessen wurde Kreativität mit einem etablierten psychologischen Verfahren, das auf sogenannter „divergenter Kreativität“ beruht. Die Aufgabe klingt zunächst banal: Die Teilnehmenden sollen zehn englische Wörter nennen, die inhaltlich möglichst wenig miteinander zu tun haben. Je größer die semantische Distanz zwischen den Begriffen, desto kreativer gilt die Antwort.
An dem Test nahmen rund 100.000 Menschen aus fünf englischsprachigen Ländern teil. Parallel dazu bearbeiteten neun große KI-Modelle exakt dieselbe Aufgabe – darunter auch das Sprachmodell GPT‑4.
Der Durchschnitt fällt – die Spitze hält stand
Die Auswertung brachte ein klares Ergebnis: Mehrere KI-Modelle erreichten höhere Kreativitätswerte als der menschliche Durchschnitt. Besonders GPT-4 lag deutlich über dem Mittelwert der menschlichen Teilnehmenden. Damit zeigt sich, dass KI bei bestimmten kreativen Denkaufgaben inzwischen konkurrenzfähig ist – zumindest, wenn man den Durchschnitt betrachtet.
Anders sieht es jedoch aus, sobald man die kreativsten Menschen betrachtet. Die obersten zehn Prozent der menschlichen Teilnehmenden erzielten Werte, die kein KI-Modell erreichen konnte. In diesem Bereich zeigte sich eine Qualität von Originalität und Vielfalt, die maschinell bislang nicht reproduzierbar ist.
Warum KI weniger überraschend ist, als sie wirkt
Ein genauerer Blick auf die Antworten erklärt diesen Unterschied. KI-Modelle neigten dazu, bestimmte Begriffe immer wieder zu verwenden. Bei GPT-4 tauchte ein einzelnes Wort in einem Großteil der Antworten auf. Menschen hingegen verteilten ihre Wortwahl deutlich breiter – selbst das häufigste menschliche Wort kam nur in einem sehr kleinen Teil der Antworten vor.
Diese Wiederholungsmuster deuten darauf hin, dass KI zwar effizient ungewöhnliche Kombinationen erzeugen kann, dabei aber oft auf statistisch „sichere“ Begriffe zurückgreift. Das Ergebnis wirkt kreativ, ist aber weniger vielfältig und weniger überraschend als menschliche Spitzenleistungen.
Mehr Zufall, mehr Kreativität – aber nur bis zu einem Punkt
Die Forschenden untersuchten auch, wie sich technische Einstellungen auf die Kreativität der KI auswirken. Wird der Zufallsanteil in den Modellen erhöht, entstehen tatsächlich vielfältigere und kreativere Antworten. Die KI rückt damit näher an menschliche Leistungen heran.
Doch selbst unter diesen Bedingungen bleibt eine Lücke: Die besonders originellen, unerwarteten Assoziationen hochkreativer Menschen erreicht die Maschine nicht. Kreativität scheint hier mehr zu sein als statistische Variation – etwa die Fähigkeit, kulturellen Kontext, persönliche Erfahrung oder emotionale Bedeutung einzubeziehen.
Nicht jede neue KI ist automatisch kreativer
Ein weiteres Ergebnis überrascht: Neuere oder effizientere KI-Versionen schnitten nicht zwingend besser ab als ältere Modelle. Teilweise zeigten frühere Versionen höhere Kreativitätswerte. Offenbar gehen technische Optimierungen, etwa für Zuverlässigkeit oder Sicherheit, manchmal zulasten kreativer Vielfalt.
Auch kleinere, weniger bekannte Modelle konnten in einzelnen Aspekten mit großen kommerziellen Systemen mithalten. Kreativität lässt sich also nicht allein an Modellgröße oder Rechenleistung festmachen.
Was sagt das wirklich über Kreativität aus?
Die Autorinnen und Autoren der Studie betonen, dass Kreativität nicht auf einen einzelnen Test reduziert werden darf. Wortassoziationen messen nur einen Ausschnitt kreativen Denkens. Aspekte wie Sinnhaftigkeit, emotionale Wirkung, kulturelle Originalität oder gesellschaftliche Relevanz bleiben außen vor.
Die Ergebnisse zeigen daher weniger, dass KI „kreativ wie ein Mensch“ ist – sondern vielmehr, dass sie bestimmte formale Kreativitätsaufgaben sehr gut beherrscht. Menschliche Kreativität im engeren Sinne, insbesondere auf Spitzenniveau, bleibt davon klar unterscheidbar.
Ein nüchternes Fazit
Künstliche Intelligenz hat einen bemerkenswerten Punkt erreicht: Sie kann kreative Aufgaben inzwischen besser lösen als der Durchschnitt der Menschen. Für Brainstorming, Ideengenerierung oder unterstützende kreative Prozesse ist sie damit ein leistungsfähiges Werkzeug.
Doch echte kreative Spitzenleistungen – das radikal Neue, Überraschende und kulturell Bedeutungsvolle – bleiben vorerst menschlich. Die Studie zeigt damit weniger eine Ablösung des Menschen als vielmehr eine neue Rollenverteilung zwischen Mensch und Maschine.
Weitere aktuelle Meldungen findest du hier:
- 2Seite 1







































































































