Blogverzeichnis Bloggerei.de
top of page


---
Aktuelle Nachrichten aus der Wissenschaft
findest du in den
Science News
---
 

Scheinkorrelationen entlarven: Warum Daten uns so leicht reinlegen

Buntes, quadratisches Cartoon-Thumbnail: Oben steht groß „Korrelation ist kein Beweis“, darunter als gelber Banner „Wie Zufall Schlagzeilen baut“. In der Mitte hält ein niedlicher Roboter mit riesigen runden Augen Diagramme und Schlagzeilen-Blätter („Kaffee = Länger Leben?“, „Montags machen unglücklich!“), umgeben von Konfetti, Fragezeichen und p-Wert-Zahlen; unten ist „Wissenschaftswelle.de“ platziert.

Scheinkorrelationen entlarven: Die Maschine, die immer Korrelationen findet


Stell dir eine Maschine vor, die in Daten wühlt wie ein Trüffelschwein im Herbstwald: unermüdlich, enthusiastisch, völlig schamfrei. Du fütterst sie mit Tabellen—Schlafstunden, Klickzahlen, Blutwerten, Wahlkreisen, Wetterdaten—und sie spuckt Schlagzeilen aus, als hätte sie gerade das Universum verstanden.


„Menschen mit Hausschuhen leben länger!“„Wer Bio kauft, wird seltener krank!“„Montage machen unglücklich – wissenschaftlich bewiesen!“

Die Maschine wirkt klug. Sie ist es auch. Nur nicht auf die Weise, wie wir hoffen.


Warum „viel suchen“ fast immer etwas findet


Die Maschine hat einen simplen Trick: Sie stellt nicht eine Frage – sie stellt tausend. Und wenn du oft genug fragst, bekommst du irgendwann „Ja“ zurück, selbst wenn die Welt in Wahrheit „Nein“ meint.


Ein Zahlenbild dazu: Wenn du bei jeder Frage ein Fehlalarm-Risiko von 5 % akzeptierst (das berühmte Signifikanzniveau 0,05) und 20 unabhängige Fragen stellst, liegt die Chance für mindestens einen zufälligen Treffer schon bei rund 64 %. Bei 100 Fragen bist du praktisch garantiert in der Trefferzone (≈ 99 %). Und plötzlich wirkt Zufall wie Erkenntnis.


Die Maschine nennt das nicht „Fehlalarm“. Sie nennt es „Durchbruch“.


So arbeitet die Korrelationen-KI – Schritt für Schritt


  1. Sie sammelt Variablen, bis es weh tut.Nicht nur „Schlaf“ und „Stress“, sondern auch Wochentag, Postleitzahl, Bildschirmhelligkeit, Schrittzahl, Herzfrequenz, Kaffee, Tee, Cola, Wetter, Jahreszeit.

  2. Sie probiert Analysen wie Outfits vor dem Spiegel.Heute ohne Ausreißer, morgen mit Ausreißern. Heute nur Frauen, morgen nur Männer. Heute linear, morgen logarithmisch. Heute „Kontrolle“ für Alter, morgen „Kontrolle“ für Einkommen.

  3. Sie stoppt, sobald es gut aussieht.Wenn nach 87 Versuchen eine Zahl endlich „beeindruckend“ ist, wird sie zur Story. Die anderen 86 verschwinden im Nirgendwo.

  4. Sie formuliert rückwärts eine Erklärung.Erst kommt der Treffer, dann die Theorie. Das Ergebnis fühlt sich dadurch nach „Aha!“ an – obwohl es genauso gut „Zufall!“ sein könnte.


Das Entscheidende: Das ist nicht zwingend Betrug. Es ist oft einfach menschlich. Unser Gehirn liebt Muster. Und es ist verdammt gut darin, sie zu sehen – auch dort, wo keine sind.


Die sieben Denkfallen, die Scheinkorrelationen so verführerisch machen


  • Mehrfachtests: Viele Würfe, viele Sechser. Irgendwann fällt einer.

  • „Garten der Abzweigungen“: Schon kleine Analyse-Entscheidungen erzeugen viele mögliche Wege – und damit viele Chancen auf Zufallstreffer.

  • Umgekehrte Kausalität: Nicht A verursacht B, sondern B beeinflusst A (oder beides gleichzeitig).

  • Dritte Variable: Etwas Unsichtbares zieht an beiden Fäden (z. B. Einkommen, Alter, Gesundheitsstatus, Bildung).

  • Selektion: Wer in der Stichprobe landet, ist nicht zufällig (Apps messen App-Nutzer, Kliniken messen Patienten).

  • Messfehler: Was wir „Stress“ nennen, ist vielleicht nur ein Fragebogen-Moment – und kein stabiler Zustand.

  • Publikations- und Aufmerksamkeitsbias: Überraschende Treffer werden erzählt, Null-Ergebnisse verschwinden.


Wenn du jetzt denkst: „Dann kann man Daten ja gar nicht trauen!“ – stopp. Die richtige Reaktion ist nicht Zynismus, sondern Handwerk: Scheinkorrelationen entlarven heißt, bessere Fragen zu stellen.


Scheinkorrelationen entlarven: Der Werkzeugkasten, der die Maschine bremst


  1. Vorher festlegen, was du testen willst (Präregistrierung).Nicht weil Exploration verboten wäre, sondern weil sie anders bewertet werden muss als „Ich habe es vorhergesagt“.

  2. Trenne Entdecken und Bestätigen.Erst Hypothesen finden (explorativ), dann mit neuen Daten prüfen (konfirmatorisch).

  3. Korrigiere für Mehrfachtests.Je mehr du testest, desto strenger müssen die Kriterien werden (z. B. Bonferroni oder False-Discovery-Rate-Methoden).

  4. Frag nach Mechanismus – nicht nur nach Kurve.Kannst du plausibel erklären, wie A zu B führt? Ohne Mechanismus bleibt die Story wacklig.

  5. Schau auf Effektgrößen und Unsicherheit, nicht nur auf „signifikant“.Ein winziger Effekt kann „signifikant“ sein – und trotzdem praktisch irrelevant.

  6. Such aktiv nach Alternativerklärungen.Welche Drittvariable könnte beide antreiben? Was wurde nicht gemessen?

  7. Bestehe auf Transparenz.Welche Daten wurden ausgeschlossen? Welche Analysen probiert? Welche nicht berichtet?


Das klingt nach Zusatzarbeit – ist aber genau der Preis dafür, dass Daten mehr sind als eine Orakelmaschine.


Ein Mini-Spickzettel für den Alltag


Wenn dir eine Korrelation als „Beweis“ verkauft wird, helfen drei schnelle Fragen:


  • Wie viele Dinge wurden getestet, bis dieser Treffer übrig blieb?

  • Was wäre die naheliegende Drittvariable?

  • Gibt es eine zweite, unabhängige Überprüfung – oder nur diese eine Grafik?


Und wenn du Lust hast, das regelmäßig zu trainieren: Abonniere den Newsletter – ich schicke dir solche „Daten-Detektiv“-Momente in verdaulichen Portionen.


Was das gesellschaftlich ändert – und warum das nicht nur Statistik ist


Scheinkorrelationen sind nicht nur ein Nerd-Problem. Sie entscheiden mit darüber, ob wir Angst bekommen, Geld ausgeben, Medikamente verlangen, Technologien verteufeln oder politische Maßnahmen feiern.


Eine Maschine, die immer Korrelationen findet, ist in Wahrheit ein Spiegel: Sie zeigt uns, wie stark wir nach eindeutigen Ursachen hungern. Die Welt ist aber oft mehrdimensional. Und genau deshalb ist „Korrelation“ so gefährlich, wenn sie als Endpunkt verkauft wird – statt als Anfang einer Untersuchung.


Wenn dir dieser Artikel geholfen hat, lass ein Like da und schreib mir in die Kommentare: Welche Korrelation ist dir zuletzt untergekommen, die „zu schön“ klang, um wahr zu sein?


Und wenn du die Wissenschaftswelle auch außerhalb dieses Blogs verfolgen willst:




Quellenliste:


  1. False-Positive Psychology (Simmons, Nelson, Simonsohn, 2011) – https://dmg5c1valy4me.cloudfront.net/wp-content/uploads/2020/09/08145800/simmons-nelson-simonsohn-false_positive_statistics-psycholsci2011.pdf

  2. The garden of forking paths (Gelman & Loken, 2013) – https://sites.stat.columbia.edu/gelman/research/unpublished/p_hacking.pdf

  3. Why Most Published Research Findings Are False (Ioannidis, 2005, PLOS Medicine) – https://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.0020124

  4. Controlling the False Discovery Rate (Benjamini & Hochberg, 1995) – https://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_hochberg1995.pdf

  5. Estimating the reproducibility of psychological science (Open Science Collaboration, 2015, Science) – https://www.science.org/doi/10.1126/science.aac4716

  6. Preregistration (Center for Open Science) – https://www.cos.io/initiatives/prereg

  7. Multiple Comparisons: Bonferroni Corrections and False Discovery Rate (Übersicht, PDF) – https://physiology.med.cornell.edu/people/banfelder/qbio/resources_2008/1.5_Bonferroni_FDR.pdf

  8. Spurious Correlations (Tyler Vigen) – https://www.tylervigen.com/spurious-correlations

  9. The Statistical Crisis in Science (American Scientist) – https://www.americanscientist.org/article/the-statistical-crisis-in-science

Kommentare

Mit 0 von 5 Sternen bewertet.
Noch keine Ratings

Rating hinzufügen
bottom of page