Methoden der Psychologie

Gütekriterien: Objektivität, Reliabilität, Validität
Das Versprechen der Präzision: Warum wir Gütekriterien brauchen
In der Wissenschaft ist eine Messung nur so viel wert wie das Instrument, mit dem sie durchgeführt wurde. Wenn wir in der Psychologie versuchen, so komplexe Dinge wie Intelligenz, Empathie oder psychische Belastung zu erfassen, können wir nicht einfach ein Maßband anlegen. Wir müssen Umwege gehen und uns auf Tests und Beobachtungen verlassen. Doch woher wissen wir, dass ein Intelligenztest nicht eigentlich nur das Bildungsniveau misst? Oder dass ein Persönlichkeitstest morgen noch dasselbe Ergebnis liefert wie heute? Um sicherzustellen, dass psychologische Forschung nicht im Bereich der Spekulation stecken bleibt, hat die Fachwelt drei zentrale Gütekriterien definiert: Objektivität, Reliabilität und Validität. Sie sind der Kompass, der uns zeigt, ob unsere Daten eine solide Brücke zur Realität schlagen oder ob wir uns im Nebel der Messfehler verirrt haben.
Diese Kriterien sind hierarchisch aufgebaut und hängen eng miteinander zusammen. Man kann sie sich wie die Schichten einer Zwiebel vorstellen: Ohne eine objektive Durchführung gibt es keine verlässliche Messung, und ohne Verlässlichkeit hat die beste Theorie keine Basis. Erst wenn alle drei Kriterien erfüllt sind, spricht man von einem wissenschaftlich fundierten Instrument. In einer Zeit, in der „Psychotests“ in Zeitschriften allgegenwärtig sind, bilden diese Kriterien die scharfe Trennlinie zwischen Unterhaltung und echter empirischer Wissenschaft.
Objektivität: Der Blick ohne Vorurteile
Das erste und grundlegendste Kriterium ist die Objektivität. Sie fordert, dass das Ergebnis einer Untersuchung vollkommen unabhängig davon sein muss, wer sie durchführt, auswertet und interpretiert. Stellen wir uns vor, zwei verschiedene Psychologen führen mit derselben Person ein Diagnosegespräch. Wenn der eine zu dem Schluss kommt, die Person sei hochgradig depressiv, während der andere sie für völlig gesund hält, dann mangelt es dem Verfahren an Objektivität. Die persönliche Meinung, die Tagesform oder die Sympathie des Forschers dürfen keinen Einfluss auf das Datenspektrum haben.
Um dies zu erreichen, setzt die Psychologie auf eine strikte Standardisierung. Ein objektiver Test hat eine exakte Anleitung, die vorschreibt, was der Versuchsleiter sagen darf, wie viel Zeit zur Verfügung steht und wie die Antworten zu bepunkten sind. Wir unterscheiden dabei drei Ebenen: Die Durchführungsobjektivität stellt sicher, dass alle Probanden unter den gleichen Bedingungen getestet werden. Die Auswertungsobjektivität garantiert, dass zwei verschiedene Personen bei derselben Antwort zur gleichen Punktzahl gelangen. Und die Interpretationsobjektivität sorgt schließlich dafür, dass aus denselben Zahlenwerten auch dieselben Schlüsse gezogen werden. Erst wenn der „menschliche Faktor“ aufseiten der Forschung minimiert ist, ist die Basis für wissenschaftliche Vergleichbarkeit gelegt.
Reliabilität: Die Verlässlichkeit der Werkzeuge
Hat man die Objektivität sichergestellt, stellt sich die nächste Frage: Wie genau misst mein Werkzeug eigentlich? Das ist die Domäne der Reliabilität, der Zuverlässigkeit. Ein reliabler Test ist einer, der bei wiederholter Anwendung unter gleichen Bedingungen auch das gleiche Ergebnis liefert. Man kann sich das wie eine Badezimmerwaage vorstellen: Wenn ich dreimal hintereinander daraufsteige und sie jedes Mal ein anderes Gewicht anzeigt, ist sie nicht reliabel – ich kann ihr schlichtweg nicht vertrauen. In der Psychologie messen wir jedoch Merkmale, die sich ständig verändern können, weshalb die Bestimmung der Zuverlässigkeit eine mathematische Herausforderung darstellt.
Es gibt verschiedene Wege, die Reliabilität zu prüfen. Bei der Retest-Reliabilität wird derselbe Test nach einer gewissen Zeit erneut durchgeführt; bei stabilen Merkmalen wie der Intelligenz sollte das Ergebnis nahezu identisch sein. Eine andere Methode ist die interne Konsistenz: Hier prüft man, ob die verschiedenen Fragen innerhalb eines Tests, die alle dasselbe messen sollen, auch „an einem Strang ziehen“. Wenn eine Person in einem Angstfragebogen angibt, panische Angst vor Spinnen zu haben, sollte sie bei einer ähnlichen Frage im selben Test nicht plötzlich angeben, völlig furchtlos zu sein. Eine hohe Reliabilität ist das mathematische Gütesiegel für die Präzision eines psychologischen Instruments – sie sagt uns, wie viel echtes Signal und wie viel störendes Rauschen in unseren Daten steckt.
Validität: Die Frage nach dem eigentlichen Kern
Das wichtigste, aber auch am schwierigsten zu erreichende Kriterium ist die Validität – die Gültigkeit. Sie stellt die alles entscheidende Frage: Misst der Test tatsächlich das, was er zu messen vorgibt? Man kann sich vorstellen, dass ein Test hochgradig objektiv und extrem präzise (reliable) ist, aber dennoch völlig am Ziel vorbeischießt. Wenn ich beispielsweise die Intelligenz eines Menschen messen will, indem ich seinen Kopfumfang mit einem digitalen Lasergerät bestimme, ist meine Messung objektiv (jeder sieht denselben Wert) und reliabel (der Kopfumfang ändert sich nicht), aber sie ist absolut nicht valide. Die Kopfgröße hat schlichtweg nichts mit der kognitiven Leistungsfähigkeit zu tun.
Die Validierung eines psychologischen Instruments ist oft ein jahrelanger Prozess. Forscher prüfen dabei etwa die Inhaltsvalidität – also ob die Testfragen das Thema in seiner ganzen Breite abdecken. Noch wichtiger ist oft die Kriteriumsvalidität: Kann mein Test ein Verhalten in der echten Welt vorhersagen? Ein valider Berufseignungstest sollte beispielsweise tatsächlich einen Zusammenhang damit aufweisen, wie erfolgreich jemand später in diesem Job ist. Die Königsdisziplin ist die Konstruktvalidität: Hier muss nachgewiesen werden, dass der Test in ein theoretisches Netzwerk passt – dass er also mit ähnlichen Merkmalen zusammenhängt und sich von theoretisch fremden Merkmalen klar abgrenzt. Die Validität ist das Herzstück der wissenschaftlichen Redlichkeit; sie entscheidet darüber, ob unsere Forschungsergebnisse eine wahre Bedeutung haben oder nur statistische Luftschlösser sind.



