Blogverzeichnis Bloggerei.de
top of page

Replikationskrise

Das Fundament gerät ins Wanken: Wenn Studien nicht halten, was sie versprechen


Stellen Sie sich vor, Sie bauen ein Haus auf einem Fundament aus Beton, von dem Sie glauben, es sei unzerstörbar. Doch eines Tages entdecken Sie einen kleinen Riss, dann noch einen, und plötzlich stellen Sie fest, dass ganze Wände zu wackeln beginnen. Genau dieses Gefühl breitete sich ab dem Jahr 2011 in der Welt der Wissenschaft aus – insbesondere in der Psychologie. Man nennt es die Replikationskrise: Die schmerzhafte Erkenntnis, dass viele bahnbrechende Studienergebnisse, die wir jahrelang in Lehrbüchern zitiert und als "felsenfest" betrachtet haben, sich einfach nicht wiederholen lassen, wenn andere Forscher dasselbe Experiment unter den gleichen Bedingungen noch einmal durchführen.


Wissenschaft lebt eigentlich von der Wiederholbarkeit. Wenn ich behaupte, dass ein bestimmter Reiz zu einer bestimmten Reaktion führt, dann muss das morgen in Berlin genauso funktionieren wie übermorgen in New York. Doch als Forscher begannen, klassische Studien systematisch zu überprüfen, erlebten sie eine herbe Enttäuschung. Es war, als würde man ein Kochrezept exakt nachkochen und plötzlich käme ein völlig anderer Kuchen dabei heraus. Diese Krise betrifft nicht nur die Psychologie, sondern hat längst auch die Medizin, die Ökonomie und sogar die moderne Forschung zum maschinellen Lernen erfasst.


Die Geburtsstunde der Krise: Von Hellsehern und verlorenen Wahrheiten


Die Krise brach nicht über Nacht aus, aber sie hatte einen markanten Wendepunkt im Jahr 2011. In diesem Jahr veröffentlichte der renommierte Psychologe Daryl Bem eine Studie, die statistisch sauber zu belegen schien, dass Menschen "in die Zukunft fühlen" können – eine Form von Hellseherei. Da die Methoden den gängigen Standards entsprachen, die Ergebnisse aber dem gesunden Menschenverstand widersprachen, dämmerte es der Fachwelt: Wenn unsere Methoden "beweisen" können, dass es Hellseherei gibt, dann stimmt vielleicht etwas mit unseren Methoden nicht.


Kurz darauf startete die "Open Science Collaboration" ein Mammutprojekt: 270 Forscher versuchten, 100 psychologische Studien aus dem Jahr 2008 zu replizieren. Das Ergebnis war ernüchternd: Nur bei etwa 36 % der Versuche konnten die ursprünglichen Effekte in ähnlicher Stärke nachgewiesen werden. Berühmte Phänomene wie die Idee, dass das Händewaschen moralische Urteile milder macht, oder bestimmte Formen des "Priming" – bei denen zum Beispiel das Zeigen einer Landesflagge die politische Einstellung beeinflussen soll – ließen sich in großen Folgeprojekten wie "Many Labs" oft nicht bestätigen. Für viele Wissenschaftler, die ihre gesamte Karriere auf solchen Effekten aufgebaut hatten, fühlte sich das wie ein Tritt in die Magengrube an.


Die Anatomie des Scheiterns: Warum Wissenschaftler (unabsichtlich) flunkern


Warum aber liefern die ersten Studien so oft "falsche" positive Ergebnisse? Es ist meistens kein böswilliger Betrug, sondern ein systemisches Problem. In der Wissenschaft herrscht ein enormer Druck, zu publizieren ("Publish or Perish"), um Karriere zu machen oder Forschungsgelder zu erhalten. Da Fachzeitschriften fast ausschließlich "spannende" und "signifikante" Ergebnisse drucken wollen – also solche, bei denen $p < 0,05$ gilt –, verschwinden Studien ohne klaren Effekt oft in der sprichwörtlichen Schublade. Dieser Publikationsbias verzerrt unser Bild der Realität: Wir sehen nur die eine Studie, die funktioniert hat, aber nicht die zehn anderen, die gescheitert sind.


Ein weiteres Problem sind die sogenannten Questionable Research Practices (QRPs). Dazu gehört das P-Hacking, bei dem Forscher ihre Daten so lange biegen, bis sie statistisch signifikant werden – etwa indem sie bestimmte Ausreißer weglassen oder mitten im Experiment die Analyse ändern, weil das Ergebnis gerade so schön aussieht. Auch das HARKing (Hypothesizing After the Results are Known) ist weit verbreitet: Man schaut sich erst die Ergebnisse an und behauptet danach, man habe genau das schon vorher vorhergesagt. Oft geschieht dies gar nicht aus böser Absicht, sondern aufgrund von mangelndem statistischem Wissen oder dem unbewussten Wunsch, dass die eigene Theorie stimmt.


Ein globales Phänomen: Nicht nur die Psychologie ist betroffen


Obwohl die Psychologie oft als Sündenbock herhalten muss, hat sie eigentlich eine Vorreiterrolle bei der Aufarbeitung übernommen. In der Medizin sieht es oft nicht besser aus: In der präklinischen Krebsforschung konnte eine große Initiative weniger als 25 % der Ergebnisse reproduzieren. Auch in der Ökonomie wurden 18 zentrale Studien überprüft, von denen nur 11 standhielten. Sogar in der modernen KI-Forschung warnen Experten vor einer neuen Replikationskrise, weil Modelle oft auf falsch validierten Daten beruhen und ihre versprochene Genauigkeit im echten Leben nicht halten.


Die Krise zeigt, dass Wissenschaft ein zutiefst menschlicher Prozess ist, der fehleranfällig bleibt, solange die Anreize falsch gesetzt sind. Wenn wir Erfolg nur an spektakulären Schlagzeilen messen, fördern wir automatisch unzuverlässige Forschung. Es ist eine Krise der Glaubwürdigkeit, die im Jahr 2026 immer noch intensiv diskutiert wird, auch wenn sie im breiten öffentlichen Bewusstsein oft noch nicht vollständig angekommen ist. Doch für die Wissenschaft selbst ist sie längst zum Motor für eine fundamentale Erneuerung geworden.


Die Rettung der Wissenschaft: Open Science als neues Betriebssystem


Was ist also die Lösung? Die Antwort lautet Open Science – eine Bewegung für mehr Transparenz und Redlichkeit. Das wichtigste Werkzeug ist hier die Präregistrierung. Forscher legen dabei ihren Plan für die Datenauswertung fest, bevor sie überhaupt mit dem Experiment beginnen. Das verhindert, dass man die Hypothesen nachträglich an die Ergebnisse anpasst (HARKing) oder so lange rechnet, bis es passt (P-Hacking).


Zusätzlich fordern Fördergeber und Universitäten immer häufiger Open Data und Open Methodology. Das bedeutet, dass nicht nur der fertige Artikel veröffentlicht wird, sondern auch der gesamte Datensatz und der verwendete Programmcode für die Analyse. So können andere Forscher jeden einzelnen Schritt nachvollziehen und auf Fehler prüfen. Es entsteht eine neue "Kultur der Fehlbarkeit", in der es nicht mehr als persönlicher Angriff gewertet wird, wenn eine Studie nicht repliziert werden kann, sondern als Teil des gesunden wissenschaftlichen Selbstkorrektur-Prozesses.


Warum die Krise das Beste ist, was der Wissenschaft passieren konnte


Die Replikationskrise klingt erst einmal deprimierend – wer möchte schon hören, dass ein Teil dessen, was wir zu wissen glauben, vielleicht falsch ist? Doch eigentlich ist sie ein Zeichen von Stärke. Sie beweist, dass die Wissenschaft die einzige menschliche Institution ist, die den Mut hat, ihre eigenen Fehler systematisch aufzudecken und zu korrigieren. Wir lernen gerade, dass Qualität wichtiger ist als Quantität und dass ein kleiner, aber belastbarer Effekt mehr wert ist als eine spektakuläre, aber unhaltbare Schlagzeile.


Wissenschaft ist heute transparenter, kritischer und ehrlicher als noch vor fünfzehn Jahren. Wir bauen unser Haus der Erkenntnis vielleicht langsamer, aber dafür auf einem Fundament, das diesen Namen wirklich verdient. Die Replikationskrise war der nötige Weckruf, um die Wissenschaft fit für die Zukunft zu machen – eine Zukunft, in der wir uns wieder auf Fakten verlassen können, weil wir wissen, wie hart sie geprüft wurden.

bottom of page