Der Turing-Test, ursprünglich von dem britischen Mathematiker und Logiker Alan Turing in seinem 1950 veröffentlichten Artikel "Computing Machinery and Intelligence" vorgeschlagen, ist ein Verfahren zur Beurteilung der Fähigkeit einer Maschine, menschenähnliches intelligentes Verhalten zu zeigen. Turing nannte es das "Imitationsspiel" und stellte die Frage, ob eine Maschine einen Menschen in einem Gespräch so täuschen kann, dass dieser sie für einen anderen Menschen hält. Ziel war es, eine operationale Definition von Intelligenz für Maschinen zu bieten, ohne sich in philosophische Debatten über Bewusstsein oder echtes Denken zu verstricken.
Das Kernprinzip des Turing-Tests ist eine Konversation zwischen einem menschlichen Prüfer (Interrogator) und zwei verborgenen Entitäten: einem menschlichen Probanden und einer Maschine. Der Prüfer kommuniziert über eine textbasierte Schnittstelle (z.B. Chat) mit beiden Probanden, ohne zu wissen, welche Identität zu welcher Entität gehört. Die Kommunikation ist ausschließlich auf Text beschränkt, um jegliche Hinweise auf Aussehen, Stimme oder andere nicht-verbale Merkmale zu eliminieren, die Rückschlüsse auf die Natur des Gesprächspartners zulassen könnten.
Die Aufgabe des Prüfers besteht darin, durch gezielte Fragen und Konversation herauszufinden, welche der beiden verborgenen Entitäten die Maschine ist und welche der Mensch. Die Maschine versucht ihrerseits, den Prüfer davon zu überzeugen, dass sie ein Mensch ist, indem sie menschliche Antworten imitiert. Der menschliche Proband versucht, dem Prüfer zu helfen, die Maschine zu identifizieren, indem er eindeutig menschliche Antworten liefert. Wenn der Prüfer nach einer festgelegten Zeitspanne und mehreren Konversationsrunden nicht in der Lage ist, die Maschine zuverlässig vom Menschen zu unterscheiden, gilt der Test als von der Maschine bestanden. Dies würde bedeuten, dass die Maschine in der Lage ist, menschliches intelligentes Verhalten so überzeugend zu simulieren, dass es von einem Menschen nicht zu unterscheiden ist.
Obwohl der Turing-Test als Meilenstein in der Geschichte der Künstlichen Intelligenz (KI) gilt und bis heute eine wichtige Referenz bleibt, ist er auch Gegenstand zahlreicher Kritikpunkte und Debatten. Ein Hauptargument ist, dass der Test lediglich die Fähigkeit zur Imitation von Intelligenz misst und nicht unbedingt echtes Verständnis, Bewusstsein oder Denken. Eine Maschine könnte den Test bestehen, indem sie vorgefertigte Antworten abruft oder statistische Muster in menschlicher Sprache erkennt, ohne die Bedeutung der Wörter tatsächlich zu erfassen. Dieses Phänomen wird oft als "Chinese Room"-Argument illustriert, das besagt, dass das Befolgen von Regeln zur Manipulation von Symbolen nicht gleichbedeutend mit Verständnis ist.
Weitere Kritikpunkte betreffen die Begrenzung auf textbasierte Kommunikation, welche andere Formen menschlicher Intelligenz wie visuelle Wahrnehmung, motorische Fähigkeiten oder Kreativität außer Acht lässt. Zudem kann der Test durch gezielte Täuschungsstrategien manipuliert werden, beispielsweise indem die Maschine absichtlich Fehler macht oder inkonsistente Antworten gibt, um menschlicher zu wirken. Trotz dieser Einschränkungen hat der Turing-Test die Forschung im Bereich der Künstlichen Intelligenz maßgeblich beeinflusst und dient weiterhin als philosophischer Prüfstein für Diskussionen über maschinelle Intelligenz und deren Grenzen. Moderne Entwicklungen in der KI, insbesondere bei großen Sprachmodellen, werfen die Frage nach der Relevanz und den Implikationen des Turing-Tests neu auf, da diese Systeme in der Lage sind, Konversationen zu führen, die oft verblüffend menschlich wirken.