Studie: KI kann mit Fachärzten mithalten
GPT-Modelle (Generative Pre-trained Transformer) sind groß angelegte Sprachmodelle mit künstlicher Intelligenz (KI), die Deep-Learning-Techniken verwenden, um menschenähnliche textbasierte Inhalte zu verstehen und zu generieren.
In der Studie wurden verschiedene KI-Sprachmodelle sowohl miteinander als auch mit der Leistung von Fachärztinnen und -ärzten unterschiedlicher Karrierestufen verglichen. Dabei wurden den Programmen und Ärzten 87 Patientenszenarien mit spezifischen Augenproblemen vorgelegt. Alle sollten aus vier Optionen eine Diagnose stellen oder Behandlungsempfehlungen geben. Damit wurden erstmals in einer Studie Fähigkeiten der KI mit denen praktizierender Ärzte verglichen und nicht nur Prüfungsergebnisse herangezogen.
Unter den Programmen setzte sich GPT- 4 gegenüber drei getesteten Sprachmodellen durch. Im Vergleich zu seinen menschlichen Konkurrenten schnitt das Programm signifikant besser ab als unerfahrene Assistenzärzte, deren Fachwissen, laut der Forschenden, mit Allgemeinmedizinern vergleichbar sei. Die KI konnte zudem mit Fachärzten in Weiterbildung sowie erfahrenen Augenärzten mithalten. Bei Einzelvergleichen mit letzteren schnitt GPT-4 in drei Fällen gleichwertig und in zwei Fällen schlechter ab. Nur besonders erfahrene Fachärzte erzielten höhere Werte als das Sprachmodell.
Die Studie wurde in der Fachzeitschrift PLOS Digital Health veröffentlicht.
Ärzte verantwortlich, KI unterstützt
Aktuell werden weltweit weitere Mengen klinischer Daten gesammelt, um KI-Modelle fortgehend zu verfeinern und zu entwickeln. Trotz allem Fortschritt liegt die Verantwortung für die Patientenversorgung weiterhin bei den Ärzten, betont der Hauptautor der Studie, Dr. Arun Thirunavukarasu. „Das Wichtigste ist, dass die Patienten selbst entscheiden können, ob sie wollen, dass Computersysteme eingesetzt werden oder nicht. Das ist eine individuelle Entscheidung für jeden Patienten", so Thirunavukarasu.
Die Forschenden betonen jedoch, dass KI-Systeme wie GPT-4 als Teil des klinischen Workflows durchaus das Potenzial haben, die Gesundheitsversorgung zu verbessern. Besonders für die Bewertung, ob und in welchen Fällen ein Spezialist oder Allgemeinmediziner aufgesucht werden muss. In Regionen mit begrenztem Zugang zu spezialisierten Augenärzten, können fortschrittliche Sprachmodelle ebenfalls eine große Unterstützung darstellen: „Die Modelle könnten klaren Algorithmen folgen, die bereits im Einsatz sind, und wir haben festgestellt, dass GPT-4 bei der Verarbeitung von Augensymptomen und -zeichen genauso gut ist wie erfahrene Kliniker, wenn es darum geht, komplexere Fragen zu beantworten", heißt es weiter.
Was ist GPT-4 ?
GPT-4 ist die aktuellste Verison der multimodalen Sprachmodelle von OpenAI. Das Programm generiert Text aus textuellen und visuellen Eingaben mithilfe von Künstlicher Intelligenz. Bereitgestellt werden die Sprachmodelle von OpenAI, einem US-amerikanisches KI-Forschungsunternehmen, das unter anderem auch ChatGPT und den Vorgänger von GPT-4, GPT-3, entwickelt hat. Der größte Unterschied zum Vorgänger ist die verbesserte Sprachverarbeitungsfähigkeit. Die Software verfügt über eine höhere Verarbeitungskapazität und kann daher komplexe Eingaben besser verstehen und verarbeiten. Diese und weitere Neuerungen sollen zu einer menschenähnlichen Kommunikation und einer größeren Präzision bei der Beantwortung von Fragen führen.