Blogverzeichnis Bloggerei.de
top of page


---
Aktuelle Nachrichten aus der Wissenschaft
findest du in den
Science News
---
 

Geschichte der IQ-Tests: Warum eine Messung zur Machtfrage wurde

Quadratisches Thumbnail im bunten Neon-Cartoonstil: Ein großer, rundäugiger Gehirn-Charakter sitzt in einem IQ-Messgerät, hält einen „100“-Stempel und ein Maßband. Oben steht „IQ: Zahl oder Schicksal?“ mit der Subheadline „Die Geschichte der Tests“, unten „Wissenschaftswelle.de“.

Die Geschichte der IQ-Tests: Wie eine Zahl die Welt sortieren lernte


Stell dir ein Klassenzimmer in Paris vor, Anfang des 20. Jahrhunderts: Kreidestaub, strenge Blicke, Kinder, die in ein System passen sollen, das für „die Mehrheit“ gebaut ist. Ein paar fallen heraus – nicht, weil sie „dumm“ wären, sondern weil das System für sie keine Sprache hat.


Genau hier beginnt die Geschichte der IQ-Tests: nicht als Maschine zum Etikettieren, sondern als Versuch, Hilfe zu organisieren. Dass daraus später eine Zahl wurde, die Türen öffnet und schließt, ist keine technische Nebenwirkung. Es ist eine gesellschaftliche Entscheidung – immer wieder neu.


Die Geschichte der IQ-Tests: 10 Wendepunkte


  • 1904–1905: Intelligenz wird messbar gedacht – und schulisch nutzbar gemacht

  • 1912: Aus „mentalem Alter“ wird eine Formel: der IQ

  • 1916: Standardisierung, Normen, Skalierung – der Test wird exportfähig

  • 1917–1918: Krieg als Beschleuniger: Massentests für Rekruten

  • 1913–1927: Eugenik, Zwang, Missbrauch – die dunkle Karriere der Zahl

  • 1939: Wechsler bricht mit dem „mentalen Alter“ – der moderne IQ entsteht

  • 1949: Kinderdiagnostik wird Alltag: WISC

  • 1960er–1970er: Fairness-Debatten: Kultur, Sprache, Bias

  • 1980er–2000er: Flynn-Effekt: Die Norm ist beweglich

  • Heute: Weg vom Einheitswert – hin zu Profilen, Kontext und Verantwortung


1904–1905: Von „g“ und dem Wunsch, Schulerfolg vorherzusagen


Bevor Tests populär wurden, kam die Idee: Vielleicht gibt es etwas Allgemeines, das viele Denkaufgaben verbindet. Charles Spearman suchte nach einem „Generalfaktor“ (später berühmt als g). Das war Statistik als Weltbild: Nicht mehr einzelne Talente zählen, sondern ein gemeinsames Muster hinter vielen Leistungen.


Fast zeitgleich passiert in Frankreich etwas Bodenständigeres – und im besten Sinne Unromantisches: Alfred Binet und Théodore Simon entwickeln Aufgaben, um Kinder zu identifizieren, die in der Schule zusätzliche Unterstützung brauchen. Kein „Wesenstest“, eher ein Frühwarnsystem: Wer kämpft gerade so sehr, dass er Hilfe verdient?


In dieser frühen Phase ist das zentrale Motiv erstaunlich sozial: Diagnostik als Zugang zu Förderung, nicht als endgültiges Urteil. Die Tragik folgt später: Zahlen wirken objektiv – und werden deshalb gern als moralische Wahrheit missverstanden.


1912: William Stern und die Erfindung einer scheinbar genialen Abkürzung


„Mentales Alter“ geteilt durch „Lebensalter“, mal 100 – fertig ist der IQ. William Stern popularisiert diese Abkürzung als Intelligenzquotient. Das klingt nach Präzision, nach Taschenrechner und Naturgesetz.


Aber die Formel verführt: Sie tut so, als wäre Intelligenz wie Körpergröße – einmal gemessen, dauerhaft. Dabei ist sie eher wie Fitness: messbar, ja, aber abhängig von Training, Gesundheit, Stress, Sprache, Schule, Erwartungen. Und schon hier zeigt sich ein Muster, das uns bis heute begleitet: Das Messbare wird für das Wesentliche gehalten.


Wenn du solche „kleinen Geschichten großer Ideen“ magst: Trag dich in den Newsletter ein – dann kommt die nächste Zeitreise direkt zu dir ins Postfach.


1916: Stanford-Binet – der Test wird industrietauglich


Der Sprung über den Atlantik verändert alles. In den USA wird die Binet-Simon-Idee adaptiert, neu normiert, stärker standardisiert. Mit dem Stanford-Binet bekommt die Messung eine Form, die sich massenhaft anwenden lässt: klare Anleitung, Vergleichswerte, ein Score, der sich wie eine Währung anfühlt.


Und wie bei jeder Währung stellt sich die Machtfrage: Wer legt den Kurs fest? Wer gilt als „durchschnittlich“? Wer definiert, was ein gutes Leben ist – und ob ein Test das abbilden kann?


Ab hier ist Intelligenz nicht mehr nur eine pädagogische Hilfskategorie. Sie wird zu einem Instrument, das Systeme lieben: vergleichbar, sortierbar, verwaltbar.


1917–1918: Krieg als Turbo – Army Alpha/Beta und das Zeitalter der Massentests


Dann kommt der Erste Weltkrieg – und mit ihm ein Problem, das nur Bürokratien so richtig lieben: Millionen Menschen müssen schnell einsortiert werden. Die Army Alpha- und Beta-Tests entstehen als Gruppentests für Rekruten; Beta als nonverbale Variante für Menschen mit Sprach- oder Lesehürden.


Das ist ein Wendepunkt, weil es den Test von der Einzeldiagnostik in die Massenverwaltung katapultiert. „Testen“ wird zu etwas, das man in Hallen machen kann, im Akkord, unter Zeitdruck, mit riesigen Konsequenzen.


Und hier zeigt sich eine Ironie: Man versucht, „Fähigkeit“ zu messen – und produziert gleichzeitig neue Verzerrungen. Sprachkompetenz, Bildung, kulturelle Vertrautheit: Alles kann in den Score hineinrauschen, ohne dass es „Intelligenz“ im engeren Sinne wäre.


Wenn du dazu eine Meinung hast: Like den Beitrag und schreib einen Kommentar – eher „Tests schaffen Fairness“ oder eher „Tests schaffen neue Ungerechtigkeit“?


1913–1927: Ellis Island, Eugenik und der Moment, in dem die Zahl weh tut


Es ist wichtig, zwei Dinge gleichzeitig auszuhalten:


  • Ja, frühe Intelligenztests wurden von Eugenikern begeistert aufgegriffen. „Feeblemindedness“ (eine damalige Sammelkategorie) wurde zur pseudowissenschaftlichen Begründung für Ausgrenzung, Institutionalisierung – und teils Zwang.

  • Nein, die populäre Vorstellung, Migrant:innen seien in den 1920ern routinemäßig mit IQ-Tests an der US-Grenze aussortiert worden, ist als generelle Praxis überzeichnet; sogar in der Fachdebatte wird betont, dass das US-Einwanderungsgesetz von 1924 keine Pflicht zu Intelligenztests vorsah.


Und dann ist da der juristische Abgrund: Buck v. Bell (1927). Der US Supreme Court hält Zwangssterilisation im Kontext eugenischer Logik für rechtlich zulässig – inklusive des berüchtigten Satzes „Three generations of imbeciles are enough.“ Das ist der Moment, in dem Testkategorien, Diagnosesprache und staatliche Gewalt unheimlich eng zusammenrücken.


Was daraus folgt, ist kein historischer Randaspekt. Es ist die Erinnerung daran, dass jede Messung von Menschen immer auch eine Machtfrage ist: Wer darf was mit dem Ergebnis tun?


1939: Wechsler und die Geburt des modernen IQ – weg vom „mentalen Alter“


David Wechsler bringt eine Idee ins Spiel, die uns heute selbstverständlich vorkommt: Vergleiche Menschen nicht mit einer „mentalen Altersstufe“, sondern mit einer Normgruppe. Also: Wie schneiden Personen im Vergleich zu Gleichaltrigen ab?


Das ist nicht nur Statistik. Es ist ein Paradigmenwechsel: Der IQ wird zu einem Abweichungswert (deviation IQ), gekoppelt an eine Normalverteilung. Damit wird der Score stabiler über Lebensalter hinweg – und das Testen von Erwachsenen wird überhaupt erst sinnvoll in derselben Logik.


Nebenbei passiert noch etwas, das viele im Alltag unterschätzen: Wechsler etabliert stärker die Idee von Profilen (verbal vs. nonverbal / Leistungsteile), also: nicht nur eine Zahl, sondern Muster. Der Einheits-IQ bleibt zwar populär – aber die Tür zu einer differenzierteren Sicht ist offen.


1949: WISC – wenn Diagnostik zum Standard in Schulen und Kliniken wird


Mit der Wechsler Intelligence Scale for Children (WISC) wird Intelligenztestung in der Kinderdiagnostik ein institutionelles Werkzeug: Schulpsychologie, Kliniken, Förderentscheidungen, teils auch Hochbegabungsdiagnostik.


Hier liegt eine Spannung, die bis heute nicht weggeht:


  • Tests können schützen: Unterforderung erkennen, Lernstörungen besser abgrenzen, Ressourcen begründen.

  • Tests können fixieren: Erwartungen einfrieren, Bildungswege vorsortieren, Selbstbilder formen („Ich bin eben nur…“).


Die Zahl ist nie nur Messwert. Sie ist auch Erzählung – besonders, wenn Erwachsene sie über Kinder aussprechen.


1960er–1970er: Bias, Kultur, Fairness – der Test wird politisch


Spätestens mit Bürgerrechtsdebatten wird klar: Ein Test ist nicht neutral, nur weil er standardisiert ist. Sprache, Aufgabenformat, kulturelles Vorwissen, Testangst, Stereotype Threat – all das kann Leistung verändern, ohne dass sich „Denkkraft“ im Kern verändert.


Die Folge ist keine einfache „Lösung“, sondern ein Umbau: bessere Normstichproben, mehr Sensibilität für Verzerrungen, zusätzliche Indizes, ergänzende Verfahren. Gleichzeitig bleibt die Versuchung groß, mit einer Zahl Komplexität zu erschlagen – weil es so bequem ist.


Wenn du mir auch außerhalb dieses Blogs folgen willst:



1980er–2000er: Der Flynn-Effekt – wenn die Norm wandert


Dann kommt eine Beobachtung, die die ganze „Fixheit“ des IQ erschüttert: In vielen Ländern steigen Testleistungen über Generationen hinweg – im Schnitt grob in der Größenordnung von mehreren IQ-Punkten pro Jahrzehnt. Das wird als Flynn-Effekt bekannt.


Das bedeutet etwas sehr Konkretes: Ein Testwert ist nicht nur „dein Kopf“, sondern auch „deine Zeit“. Bildung, Ernährung, Gesundheitsversorgung, kognitive Alltagsanforderungen, Testvertrautheit – all das kann Populationen nach oben oder unten bewegen.


Und plötzlich ist die scheinbar feste Zahl wieder das, was sie immer war: ein Vergleich innerhalb eines historischen Moments, keine Plakette fürs Leben.


Was wir heute aus der Geschichte der IQ-Tests lernen sollten


Erstens: Intelligenztests messen Leistung in einem bestimmten Aufgabenraum – nicht den Wert eines Menschen.


Zweitens: Kontext ist keine Ausrede, sondern Teil der Messung. Wer Sprache, Bildung und Stress ignoriert, misst nicht „purer“.


Drittens: Die gefährlichste Frage ist nicht „Wie hoch ist der IQ?“, sondern „Wofür wird er benutzt?“ Förderung? Diagnostik? Selektion? Ausschluss?


Viertens: Ein Profil ist oft ehrlicher als ein Stempel. Die moderne Diagnostik arbeitet nicht zufällig mit mehreren Indizes und Zusatzinformationen – weil Menschen nicht eindimensional sind.


Wenn du willst, dass mehr solcher Texte entstehen: Abonnier den Newsletter, teil den Beitrag mit jemandem, der bei „IQ“ sofort in Lagerdenken rutscht – und schreib mir in die Kommentare, welche Wendepunkte dich am meisten überrascht haben.




Quellenliste:


  1. Spearman (1904): „General Intelligence…“ (PDF) – https://gwern.net/doc/iq/1904-spearman-2.pdf 

  2. Binet–Simon: Publikationen ab 1905, Versionen 1905/1908/1911 – https://en.wikipedia.org/wiki/Binet%E2%80%93Simon_Intelligence_Test 

  3. Binet-Simon als altersgestufte Skala (historische Darstellung, PDF) – https://www.russellsage.org/sites/default/files/Ayres_BinetSimon%20Test_0.pdf 

  4. Stern und der IQ (1912) in historischem Kontext (PMC) – https://pmc.ncbi.nlm.nih.gov/articles/PMC10532681/ 

  5. Terman (1916): „The Measurement of Intelligence“ (Volltext) – https://www.gutenberg.org/files/20662/20662-h/20662-h.htm 

  6. Army Alpha/Beta: Einführung 1917–1918 (History of Military Testing) – https://www.officialasvab.com/researchers/history-of-military-testing/ 

  7. Wechsler-Bellevue (1939) und Abkehr von mental age/chronological age (PDF) – https://www.blackwellpublishing.com/content/personalityandindividualdifferences/9781405130080_4_006.pdf 

  8. WISC: Erste Version 1949 (PMC, 2025) – https://pmc.ncbi.nlm.nih.gov/articles/PMC12295690/ 

  9. Flynn-Effekt (Meta-Analyse, 2014, PMC) – https://pmc.ncbi.nlm.nih.gov/articles/PMC4152423/ 

  10. Immigration Act 1924: keine Pflicht zu Intelligenztests (Nature, 2019) – https://www.nature.com/articles/d41586-019-02925-6 

  11. Eugenik: Definition und Fehlschlüsse (Genome.gov) – https://www.genome.gov/about-genomics/fact-sheets/Eugenics-and-Scientific-Racism 

  12. Buck v. Bell (1927), Originaltext inkl. Zitat – https://supreme.justia.com/cases/federal/us/274/200/ 

Kommentare

Mit 0 von 5 Sternen bewertet.
Noch keine Ratings

Rating hinzufügen
bottom of page