Ich störe mich an der Rezeption einer US-Studie, es geht um ChatGPT-Antworten auf medizinische Fragen. Oft sind die Titel der Medienberichte stumpf, die Texte selbst aber besser. „Ist die Künstliche Intelligenz empathischer als der Arzt?“, titelt etwa der MDR, und wie bei fast jeder Überschrift mit Fragezeichen ist die Antwort: unklar, eher nicht.

Die Studie ist schnell zusammengefasst. Forscher*innen haben sich aus einem Reddit-Forum 195 medizinische Fragen und Anworten geschnappt. In dem Forum antworten offenbar medizinisch geschulte Nutzer*innen. Alternativ zu den bereits vorliegenden Antworten haben sich die Forschenden neue Antworten von ChatGPT generieren lassen. Dann haben sie Gesundheitsexpert*innen gebeten, die menschlichen und maschinellen Antworten miteinander zu vergleichen. Ergebnis: Die maschinellen Antworten wurden als einfühlsamer und inhaltlich besser bewertet.

Bei beiden Aspekten – einfühlsam und inhaltlich – halte ich kritische Einordnung für angebracht. Diese Einordnung entzaubert die Erkenntnisse der Studie allerdings als so unspektakulär, dass eine Nachrichtenmeldung über die Studie wenig sinnvoll ist.

Die inhaltliche Dimension

Erst einmal sind medizinische Tipps über Krankheiten im Internet grundsätzlich oberflächlich, bedenklich und vorläufig. Ärzt*innen kennen den Spruch „Keine Diagnose durch die Hose“. Das heißt, man muss Patient*innen selbst befragen, individuelle Beobachtungen machen und auf Grundlage von Leitlinien und der eigenen Erfahrung professionelle Schlüsse ziehen. Erstaunlich oft ist der beste Rat, den man in einem Forum kriegen kann: Bitte hol dir nen Praxistermin.

Wenn Expert*innen nun die maschinell generierten Antworten auf medizinische Fragen als fachlich besser einordnen, dann bedeutet das nicht, dass diese Antworten den Patient*innen auch wirklich helfen. Das beste, was Menschen und Chatbots in einem solchen Forum tun können, ist: raten. Man könnte allenfalls erforschen, ob Chatbots in einem solchen Szenario besser raten als ein Mensch. Unterm Strich kann und sollte so ein Gerate aber keine Untersuchung ersetzen.

Die emotionale Dimension

Medizinisches Personal ist meist unterbesetzt und hat alle Hände voll zu tun. Sich lakonisch und kurz zu fassen kann Menschenleben retten, weil man andernfalls andere Menschen in Not warten lässt. Mich wundert es nicht im geringsten, dass ein Chatbot empathischer rüberkommt, weil er mühelos jede Menge freundlich klingende Sätze generieren kann. Vielleicht lohnt sich die Forschung nach dem gezielten Einsatz von Chatbots, um Menschen vorm Fachgespräch erst einmal etwas zu beruhigen.

Letztlich finde ich 195 Antworten aus einem Reddit-Forum allerdings ziemlich dünn, um daraus mehr als erste Hinweise für weitere Forschung zu ziehen. Liefert die Studie wirklich einen Vergleich zwischen Mensch und Maschine, oder bloß zwischen Reddit und Maschine? Aus gutem Grund schlussfolgern die Forschenden den Bedarf nach weiterer Forschung. Jede Nachrichtenmeldung, die bei dieser Studie eine Überlegenheit der Maschine suggeriert, halte ich für drastisch überdreht.

Die KI-Dimension

Wenig sachdienlich finde ich auch Saschas Lobos Rezeption der Studie im SPIEGEL. Trotz einiger sinnvoller Relativierungen schreibt er letztlich: „maschinell herstellbare Empathie existiert offenbar, und sie könnte diejenige des Menschen übertreffen“.

Ich sehe darin vor allem KI-Hokuspokus. Man kann zum Beispiel auch sehr viel Empathie beim Kuscheln mit einem Teddybären empfinden, und das machen Erwachsene vermutlich viel zu selten. Allerdings überhöhe ich das dann nicht als Plüsch-erzeugte Empathie, die vielleicht dem Menschen überlegen ist.

Mit noch mehr Abstand betrachtet halte ich die Erzählung von einer baldigen Revolution der Medizin durch ChatGPT für grundlegend verfehlt – und für ein anschauliches Beispiel des derzeit aufgeblasenen KI-Hypes.

Zumindest in Deutschland bedeutet der Alltag in Praxen und Kliniken nach wie vor: Befunde per Faxgerät verschicken, Rezepte auf Papier ausdrucken, handschriftliches Gekrakel anfertigen und wieder entziffern. Patient*innen lassen stundenlang die Kabeltelefone bimmeln, bloß um einen der viel zu dünn gesäten Termine zu kriegen. Wenn es nur an der Technologie läge, könnte schon der technologische Stand der 90er-Jahre eine Revolution im Gesundheitswesen bewirken.

Werbung