Blogverzeichnis Bloggerei.de
top of page

Metakognitive Selbstüberschätzung: Was der Dunning-Kruger-Effekt wirklich zeigt

Aktualisiert: 10. Mai

Quadratisches Cover mit einem nachdenklichen Gesicht vor gespaltener Prüfungs- und Datenkulisse, darüber die gelbe Headline „DUNNING-KRUGER?“ und auf rotem Banner der Satz „Warum Sicherheit kein Können beweist“.

Der Dunning-Kruger-Effekt gehört zu jenen psychologischen Begriffen, die im Internet fast immer selbstbewusster verwendet werden als in der Forschung. Kaum äußert jemand besonders laut eine schlechte Meinung, erklärt irgendwer sofort: klassischer Dunning-Kruger. Gemeint ist meist etwas Einfaches und ziemlich Hässliches: Die Dümmsten halten sich für die Klügsten.


Genau das macht den Begriff so attraktiv. Er ist wissenschaftlich genug, um überlegen zu klingen, und scharf genug, um andere elegant abzuwerten. Das Problem ist nur: So sauber zeigt die Forschung das nicht.


Ja, es gibt ein robustes Grundmuster. Menschen mit schwacher Leistung überschätzen sich bei manchen Aufgaben im Schnitt stärker als Menschen mit hoher Leistung. Aber daraus folgt nicht automatisch, dass schlechte Performer grundsätzlich blind für die eigene Inkompetenz sind. Und es folgt schon gar nicht, dass der berühmte Quartil-Plot die ganze psychologische Wahrheit bereits auf dem Silbertablett serviert.


Was der Dunning-Kruger-Effekt wirklich zeigt, ist interessanter und unbequemer zugleich. Er erzählt weniger von der Dummheit anderer als von den Grenzen menschlicher Selbstbeurteilung unter Unsicherheit.


Was Kruger und Dunning 1999 tatsächlich fanden


Der Ausgangspunkt war die klassische Studie von Justin Kruger und David Dunning. Sie ließen Studierende Aufgaben zu Humor, Grammatik und logischem Denken bearbeiten und fragten sie danach, wie gut sie im Vergleich zu anderen abgeschnitten hätten.


Das bekannte Ergebnis: Wer objektiv im unteren Leistungsquartil lag, schätzte die eigene relative Leistung deutlich zu hoch ein. Wer sehr gut abschnitt, unterschätzte sich dagegen eher. Berühmt wurde vor allem die Pointe, dass die Schwächsten im Test sich ungefähr im Mittelfeld oder sogar deutlich darüber verorteten.


Die Deutung der Autoren war stark und eingängig. Wer in einem Bereich wenig Kompetenz besitzt, dem fehlen oft gerade jene Fähigkeiten, die man bräuchte, um die Qualität der eigenen Antworten sauber zu erkennen. Schlechte Leistung und schlechte Selbstdiagnose seien also kein Zufall, sondern zwei Seiten desselben Problems.


Kernidee: Die ursprüngliche These war stärker als nur „Menschen irren sich“


Kruger und Dunning behaupteten nicht bloß, dass Menschen danebenliegen. Sie argumentierten, dass geringe Kompetenz selbst die Einsicht in diese geringe Kompetenz beschädigen kann.


Warum das Muster so plausibel wirkt


Die Intuition hinter dem Effekt ist stark, weil wir sie aus dem Alltag kennen. Wer ein Thema nur oberflächlich versteht, sieht oft vor allem die sichtbaren Antworten, nicht aber die verdeckten Qualitätskriterien. Sobald man ein paar Begriffe gelernt hat, fühlt sich vieles schon überraschend rund an. Erst mit mehr Wissen merkt man, wie groß das Gelände hinter der ersten Kuppe eigentlich ist.


Dieses Muster wurde später auch von Sanchez und Dunning beschrieben: Ein bisschen Lernen kann Selbstvertrauen schnell erhöhen, noch bevor Menschen gut darin werden, die Grenzen ihres Wissens zu beurteilen. Der gefährliche Moment ist also oft nicht völlige Ahnungslosigkeit, sondern frühe Vertrautheit.


Das erklärt, warum der Effekt gesellschaftlich so anschlussfähig ist. In Politik, Medien, Investmentblasen oder Gesundheitsdebatten trifft man immer wieder auf Menschen, deren Sicherheit größer wirkt als ihr Verständnis. Nur ist diese Beobachtung noch keine fertige Theorie. Sie muss sich an Daten messen lassen.


Der erste große Haken: Das berühmte Diagramm ist methodisch nicht unschuldig


Je populärer der Dunning-Kruger-Effekt wurde, desto genauer schauten andere Forschende auf die Statistik hinter dem Klassiker. Dabei zeigte sich schnell: Das berühmte Muster kann teilweise auch ohne besondere metakognitive Blindheit entstehen.


Der Grund ist banal und wichtig zugleich. Wenn Menschen ihre Leistung auf einer begrenzten Skala schätzen, dann haben schlechte Performer nach unten kaum Platz für weitere Irrtümer, aber viel Platz nach oben. Sehr gute Performer haben das spiegelbildliche Problem. Sie können sich leichter nach unten verschätzen als nach oben. Dazu kommen Regressionseffekte und die künstliche Schärfe, die durch die Aufteilung in Quartile entsteht.


Burson, Larrick und Klayman zeigten schon 2006, dass die Genauigkeit relativer Selbsteinschätzung stark davon abhängt, wie schwierig eine Aufgabe erlebt wird. Auf manchen Aufgaben unterschieden sich gute und schlechte Performer viel weniger in ihrer Kalibrierung, als die populäre Lesart erwarten ließe. Mit anderen Worten: Nicht jeder Fehler im Selbsturteil ist ein Spezialproblem der Schwächsten.


Noch schärfer formulierten es Magnus und Peresetsky. Sie argumentierten 2022, dass sich das klassische Dunning-Kruger-Muster zu großen Teilen als statistisches Artefakt modellieren lasse, wenn man Randbeschränkungen und Fehlerverteilungen sauber berücksichtigt.


Faktencheck: „Es ist nur Statistik“ ist selbst schon eine Zuspitzung


Die Kritik zeigt überzeugend, dass das berühmte Muster methodisch aufgeblasen werden kann. Sie beweist aber nicht automatisch, dass psychologische Unterschiede in Selbstbewertung gar keine Rolle spielen.


Der zweite Haken: Schlechte Selbstbeurteilung ist nicht dasselbe wie schlechte Metakognition


Hier liegt der entscheidende Unterschied zwischen Meme und Wissenschaft. Viele Menschen lesen den Effekt so, als beweise er eine simple moralische Ordnung: Wer schlecht ist, merkt es nicht. Wer gut ist, zweifelt mehr. Fertig.


Neuere Forschung ist vorsichtiger. Sie trennt stärker zwischen verschiedenen Ebenen:


  • objektive Leistung

  • globales Selbsturteil

  • momentane Sicherheit bei einzelnen Antworten

  • generelle Antworttendenz, also eher hohe oder eher niedrige Selbstsicherheit


In einem großen Replikationsprojekt entwickelten Jansen, Rafferty und Griffiths ein rationales Modell der Selbstbewertung und testeten es mit jeweils rund 4.000 Teilnehmenden. Das Ergebnis war differenziert. Das klassische Muster ließ sich reproduzieren. Aber es konnte aus mindestens zwei Mechanismen entstehen: aus starken Vorannahmen über die eigene Fähigkeit oder aus geringerer Sensitivität dafür, ob einzelne Antworten korrekt waren. Der Effekt war also nicht einfach ein psychologischer Stempel „unfähig und ahnungslos“, sondern ein Gemisch aus Erwartung, Evidenzverarbeitung und Aufgabenstruktur.


Noch deutlicher wurde die Korrektur bei McIntosh und Kolleginnen und Kollegen. In ihrem Registered Report zu einer Matrix-Reasoning-Aufgabe fanden sie keinen klaren Beleg für die populäre Dual-Burden-Version. Schlechtere Performer nutzten zwar weniger diagnostische Information, aber ihre metakognitive Effizienz war nicht einfach generell defekt. Das klassische Muster wurde vor allem durch Leistungsverteilung und Regressionslogik getragen. Der Satz „die Inkompetenten wissen es nicht“ war damit zu grob.


Was der Effekt also wirklich nahelegt


Wenn man die Forschung zusammennimmt, bleibt weder die totale Entzauberung noch die Meme-Version übrig. Plausibel bleibt etwas Drittes.


Erstens: Menschen sind in der Selbsteinschätzung generell nicht besonders gut. Das ist kein Sonderfehler weniger Personen, sondern ein strukturelles Problem menschlicher Kognition.


Zweitens: Geringe Kompetenz kann Selbstbeurteilung tatsächlich erschweren, weil man ohne gutes Sachwissen oft nicht erkennt, welche Merkmale eine gute Antwort von einer schlechten unterscheiden. Wer die Qualitätsmaßstäbe nicht beherrscht, kann auch den eigenen Output schwer messen.


Drittens: Das klassische Bild wird statistisch überzeichnet. Besonders die berühmte Form des Effekts, also starke Überschätzung unten und leichte Unterschätzung oben, entsteht teilweise schon aus der Art, wie Leistungen gruppiert und Schätzfehler begrenzt werden.


Viertens: Selbstüberschätzung ist keine Eigenschaft „der Dummen“. Sie hängt an Aufgabenformaten, Feedback, Vergleichsmaßstäben, sozialer Erwünschtheit und Vorwissen. Auf anderen Aufgaben können die Unterschiede kleiner sein oder anders aussehen.


Warum der Effekt im Alltag trotzdem relevant bleibt


Die Korrektur macht den Effekt nicht belanglos. Im Gegenteil. Sie macht ihn nützlicher.


Denn die eigentliche Lehre lautet nicht, dass wir dumme Leute entlarven sollen. Sie lautet, dass Lernen immer zwei Ebenen braucht: bessere Antworten und bessere Rückmeldung darüber, wie gut diese Antworten wirklich sind. Wer nur Wissen addiert, aber nie lernt, Fehlerqualität zu erkennen, baut leicht ein fragiles Selbstvertrauen auf.


Das ist in Schulen relevant, wo Prüfungen oft Leistung messen, aber selten metakognitive Kalibrierung trainieren. Es ist in Unternehmen relevant, wo Lautstärke leicht mit Kompetenz verwechselt wird. Es ist in der Politik relevant, wo überzeugte Vereinfachung oft schneller zirkuliert als begründete Unsicherheit. Und es ist im Netz relevant, wo jeder Vergleich mit anderen auf extrem dünnen Informationsschichten ruht.


Merksatz: Selbstsicherheit ist kein zuverlässiger Kompetenzmarker


Hohe Gewissheit kann aus Wissen kommen. Sie kann aber genauso aus schlechter Rückmeldung, groben Heuristiken oder einem zu kleinen inneren Modell der Aufgabe entstehen.


Die eigentliche Pointe ist bescheidener und klüger


Vielleicht ist das die schönste Ironie des Dunning-Kruger-Effekts: Gerade seine populäre Überdehnung ist selbst ein Beispiel für zu frühe Sicherheit. Ein empirisches Muster wird entdeckt, in ein starkes Narrativ übersetzt und dann als universeller Schlüssel für andere Menschen benutzt. Genau so verwandelt man Forschung in Slogan.


Wissenschaftlich sauberer ist eine bescheidenere Lesart. Menschen urteilen über sich selbst mit systematischen Verzerrungen. Wer wenig kann, hat oft auch weniger gutes Material, um das eigene Können zu beurteilen. Aber das berühmte Bild vom inkompetenten Großmaul ist keine vollständige Theorie, sondern eine überzeichnete Pop-Version eines komplizierten Befundes.


Was der Dunning-Kruger-Effekt wirklich zeigt, ist damit fast interessanter als das Meme. Er erinnert daran, dass Erkenntnis nicht nur bedeutet, Antworten zu haben. Erkenntnis bedeutet auch, das Verhältnis zwischen Antwort und Sicherheit richtig einzuschätzen. Und genau darin sind Menschen oft weit weniger souverän, als sie denken.



Weiterlesen


Kommentare

Mit 0 von 5 Sternen bewertet.
Noch keine Ratings

Rating hinzufügen


Mehr aus dem Blog
 

bottom of page