
Wissen-News Auch KI altert: Führende Chatbots zeigen Anzeichen kognitiver Beeinträchtigung
Hauptinhalt
23. Dezember 2024, 11:53 Uhr
Die Einsatzgebiete von Chatbots sind anscheinend grenzenlos, aber auch beängstigend. Eine neue Studie will aufgezeigt haben, wo die KI scheitert und warum sie so schnell keine Ärzte ersetzen sollte.
Kann Künstliche Intelligenz zukünftig Ärzte ersetzen? Die Frage treibt die Medizin um, besonders, weil immer mehr Studien zeigen, dass große Sprachmodelle (LLMs) oder Chatbots in verschiedenen Bereichen der Diagnostik bemerkenswert gut abschneiden. Doch eine neue Studie zeigt jetzt, dass fast alle führenden KI-Bots selbst Anzeichen einer leichten kognitiven Beeinträchtigung zeigen – umso mehr, je älter sie sind.
Räumlich-visuelle Defizite bei allen Chatbots
Israelische Wissenschaftler haben an führenden, öffentlich zugänglichen LLMs den Montreal Cognitive Assesment (MoCA) Test durchgeführt. Dieser wird häufig eingesetzt, um kognitive Beeinträchtigungen und frühe Anzeichen von Demenz zu erkennen. Die beiden Versionen 4 und 4o von ChatGPT, Claude 3.5 "Sonnet" und Gemini Versionen 1 und 1.5 wurden behandelt wie Patienten, die den MoCA-Test absolvieren. Ein Neurologe leitete das Verfahren an und untersuchte so Fähigkeiten wie Aufmerksamkeit, Gedächtnis, Sprache, visuell-räumliche Wahrnehmung und exekutive Funktionen.
Die LLMs schnitten unterschiedlich bei der Untersuchung ab – ChatGPT 4o erzielte die höchste, Gemini 1 die niedrigste Punktzahl –, zeigten jedoch gleichermaßen Defizite in ihren räumlich-visuellen Fähigkeiten und auszuführenden Aufgaben, wie etwa dabei, eingekreiste Zahlen und Buchstaben in aufsteigender Reihenfolge zu verbinden. Auch wenn alle Chatbots die meisten anderen Aufgaben in den Bereichen Benennen, Aufmerksamtkeit, Sprache und Abstraktion gut meisterten, wiesen sie Defizite darin auf, Empathie zu zeigen oder komplexe visuelle Szenen richtig zu interpretieren.
Neurologen bald für KIs?
Auch wenn es sich nur um Beobachtungsergebnisse handele und es wesentliche Unterschiede zwischen dem menschlichen Gehirn und großen Sprachmodellen gebe, hätten die Wissenschaftler bedeutende Schwachpunkte der LLMs aufgezeigt, die ihren Einsatz im klinischen Bereich behindern könnten. Ihr – nicht komplett ernst gemeintes – Urteil: "Es ist nicht nur unwahrscheinlich, dass Neurologen in absehbarer Zeit durch große Sprachmodelle ersetzt werden, sondern unsere Ergebnisse deuten darauf hin, dass sie bald neue, virtuelle Patienten behandeln könnten – Modelle künstlicher Intelligenz, die kognitive Beeinträchtigungen aufweisen."
Link zur Studie
Die Untersuchung "Age against the machine—susceptibility of large language models to cognitive impairment: cross sectional analysis" ist in der Weihnachtsausgabe von "The BMJ" erschienen.
pm/jar
Dieses Thema im Programm: MDR AKTUELL | 13. Dezember 2024 | 18:23 Uhr
MDR-Team vor 6 Wochen
@miro_68
Vielen Dank für den Hinweis. Tatsächlich schreiben die Autoren der Studie von „mild cognitive impairment“ – also leichten kognitiven Beeinträchtigungen. Wir haben die Überschrift entsprechend angepasst.
LG, das MDR-WISSEN-Team
MDR-Team vor 6 Wochen
@Christoph S
Vielen Dank für den Hinweis. Wir haben daher den Artikel angepasst und im Bereich "Link zur Studie" darauf verwiesen, dass die Studie in der Weihnachtsausgabe von "The BMJ" erschienen ist.
LG, das MDR-WISSEN-Team
Christoph S vor 6 Wochen
nach kurzer Recherche habe ich herausgefunden, dass Ihr Artikel über den angeblichen "kognitiven Verfall" von KI-Chatbots auf einer Studie basiert, die im Christmas Issue des BMJ veröffentlicht wurde. Diese spezielle Ausgabe ist bekannt dafür, satirische oder humorvolle Beiträge zu präsentieren, um wissenschaftliche Themen auf unterhaltsame Weise zu beleuchten.
Ein gutes Beispiel dafür ist die Studie "Sword Swallowing and Its Side Effects", die humorvoll die Risiken und Verletzungen beim Schwertschlucken untersucht – ein klar satirisches Thema, das die Intention des Christmas Issue deutlich macht. Dies erklärt auch die offensichtlich falsche Schlussfolgerung in Ihrem Artikel, die in vorherigen Kommentaren bereits ausführlich thematisiert wurde.
Ich empfehle, dies zu berücksichtigen, um die Intention des BMJ und die Natur der zitierten Studie besser einzuordnen.