KI kann Fehldiagnosen nicht verhindern

Bild: Pexels/Karolina Grabowska

Typography
  • Smaller Small Medium Big Bigger
  • Default Helvetica Segoe Georgia Times

Etwa jede zehnte Diagnose stimmt nicht. Ein Forschungsteam hat in einer grossen Studie untersucht, ob künstliche Intelligenz die Diagnose verbessern kann. Das Resultat überrascht: Entgegen den hohen Erwartungen zeigt das getestete System keinen messbaren Vorteil gegenüber herkömmlichen Diagnoseverfahren.

Etwa jede zehnte Diagnose erweist sich bei näherer Betrachtung als falsch. Ein Forschungsteam unter der Leitung des Inselspitals, Universitätsspital Bern und der Universität Bern hat in einer umfangreichen Studie untersucht, ob ein KI-basiertes Diagnosesystem die Qualität der Diagnosestellung verbessern könnte. Das Ergebnis überrascht: Trotz hoher Erwartungen zeigt das getestete System keinen messbaren Vorteil gegenüber den herkömmlichen diagnostischen Prozessen. Fehldiagnosen gehören somit zu den häufigsten und kostspieligsten medizinischen Problemen weltweit, insbesondere in Notaufnahmen, wo oft unter grossem Zeitdruck eine Vielzahl von Patienten und Patientinnen mit unterschiedlichen Beschwerden behandelt werden. Zur Reduzierung von Fehldiagnosen werden vermehrt computergestützte diagnostische Entscheidungshilfesysteme (auf Englisch "Computerized Diagnostic Decision Support Systems", kurz: CDDSS) eingesetzt. Diese Systeme analysieren Symptome und Befunde, um die diagnostische Genauigkeit zu erhöhen und das medizinische Fachpersonal bei der Diagnosestellung zu unterstützen. Die Wirksamkeit von Diagnosesystemen, die auf künstlicher Intelligenz (KI) basieren, ist jedoch umstritten. Es liegen derzeit noch kaum belastbare Studiendaten aus der klinischen Anwendung vor.

Weltweit erste Studie zu KI-gestützter Akutdiagnostik

Ein Forschungsteam unter der Leitung der Universitätsklinik für Notfallmedizin des Inselspitals hat nun in der weltweit ersten Studie zu CDDSS die Wirksamkeit von KI-basierter Diagnoseunterstützung in der Akutmedizin untersucht. An der Studie, deren Ergebnisse soeben in «The Lancet Digital Health» erschienen sind, nahmen insgesamt 1204 Patientinnen und Patienten teil, die zwischen Juni 2022 und Juni 2023 mit unspezifischen Beschwerden (wie Ohnmacht, Bauchschmerzen oder Fieber unbekannter Ursache) in vier Schweizer Notfallstationen behandelt wurden. Die teilnehmenden Notfallstationen wurden alternierend in zwei Interventionsphasen eingeteilt: In den Interventionsphasen nutzten die Ärztinnen und Ärzte das KI-basierte System «Isabel Pro», das sie bei der Diagnosestellung unterstützte. In den Kontrollphasen wurden die Diagnosen ohne technische Unterstützung gestellt. Die Qualität der Diagnosen wurde daran gemessen, ob die Patientinnen und Patienten innerhalb von 14 Tagen nach der Behandlung eine ungeplante medizinische Nachsorge benötigten, ob Diagnosen im Nachhinein geändert wurden, ob eine unerwartete intensivmedizinische Behandlung erforderlich war oder ob Todesfälle auftraten.

Die Ergebnisse überraschen: sowohl in der Phase mit als auch in der Phase ohne KI-basierter Diagnoseunterstüztung trat bei 18 Prozent der Patienten und Patientinnen ein diagnostisches Qualitätsrisiko auf. Auch bezüglich schwerwiegenden unerwünschten Ereignissen und dem Ressourcenverbrauch, gemessen in Schweizer Franken, gab es keine Unterschiede zwischen den Gruppen.

Die Studie konnte trotz optimierter Technologie und umfangreicher Schulung des medizinischen Personals keinen relevanten Vorteil durch den Einsatz von CDDSS nachweisen. «KI-basierte Diagnoseunterstützung hat in der Notfallmedizin keinen messbaren Effekt für die Patientinnen und Patienten. Unabhängig davon, ob man nach medizinischen, ökonomischen oder prozeduralen Unterschieden sucht», fasst Prof. Dr. Wolf Hautz, Oberarzt an der Universitätsklinik für Notfallmedizin und Erstautor der Studie, die Ergebnisse zusammen. Die Ergebnisse der Studie zeigen, dass computergestützte Diagnosesysteme zumindest auf dem aktuellen Entwicklungsstand keinen signifikanten Einfluss auf die diagnostische Qualität in der Notfallmedizin haben. «Die derzeit verfügbare KI wird das Problem der Fehldiagnosen nicht lösen. Wir müssen andere Ansätze verfolgen, um die diagnostische Qualität zu verbessern und insbesondere die Forschung zu diesem Thema, die heute noch in den Kinderschuhen steckt, deutlich intensivieren», ergänzt Prof. Hautz. Zu diesem Zweck unterstützt der Schweizerische Nationalfonds (SNF) den Aufbau einer Arbeitsgruppe zum Thema «Collaborative Decision Making» an der Universitätsklinik für Notfallmedizin des Inselspitals. Die aktuelle Studie wurde durch das Nationale Forschungsprogramm «Digitale Transformation» (NFP 77) des SNF mitfinanziert. (lfa)

Wir verwenden Cookies auf unserer Website. Einige von ihnen sind für den Betrieb der Website von wesentlicher Bedeutung, während andere uns dabei helfen, diese Website und die Benutzererfahrung zu verbessern (Tracking-Cookies). Sie können selbst entscheiden, ob Sie Cookies zulassen möchten oder nicht. Bitte beachten Sie, dass Sie möglicherweise nicht alle Funktionen der Website nutzen können, wenn Sie sie ablehnen.