KI in der klinischen Forschung

Am 27. November 2025 lud die Österreichische Gesellschaft für Pharmazeutische Medizin (GPMed) in Kooperation mit der Medizinischen Universität Wien zur Online-Veranstaltung „Künstliche Intelligenz in der klinischen Forschung“. Moderiert wurde diese von Mag.a (FH) Veronika Mikl, stellvertretende Leiterin des Research Innovation Circle der GPMed.

Vom Hype zur praktischen Anwendung

Im ersten Vortrag der Veranstaltung „KI in der akademischen Forschung – Vom Hype zur praktischen Anwendung“ widmete sich Georg Langs, Leiter des Comprehensive Center for AI in Medicine (CAIM), MUW, der zentralen Frage, in welchen Bereichen der Forschung bzw. der Medizin künstliche Intelligenz (KI) sinnvoll eingesetzt werden kann. Bereits in seiner Einleitung hob Langs hervor, dass KI-Algorithmen beispielsweise zur schnellen Diagnose in der Neurochirurgie eingesetzt werden könnten, was Abläufe im OP verändern würde. Auch in der Radiologie kann KI die Bildgebung verändern: So machen beispielsweise KI-unterstützte Beurteilungen von Thorax-CTs die Bilddaten quantifizierbar, wodurch sie mit klinischen Verläufen in Zusammenhang gebracht werden können und damit einen Beitrag zu Entscheidungen bezüglich des weiteren Patientenmanagements leisten. Langs betonte weiters, dass KI immer nur eine Unterstützung sei. Die Entscheidung selbst verbleibe beim behandelnden Team, doch durch die hohe Leistungsfähigkeit und die Geschwindigkeit der KI-Systeme werde die Entscheidungsgrundlage verbreitert und unter Umständen auch verfeinert, ist Langs überzeugt.

Neben Diagnose und Verlaufsbeobachtungen können KI-Modelle auch für die Identifizierung von Prognosemarkern und das Erkennen neuer Targets eingesetzt werden. Als Beispiel hierfür nannte Langs das nicht-invasive Tracking von neuen Behandlungen von NASH/MASH (MASH = Metabolische Dysfunktion-assoziierte Steatohepatitis, früher als NASH bezeichnet; eine schwere entzündliche Lebererkrankung, die durch metabolische Ursachen bedingt ist): Aus­gehend von MR-Bildern der Leber werden unterschiedliche Gewebe„texturen“ identi­fiziert, quantitativ erfasst und die Veränderungen über die Zeit abgebildet. Im Vergleich zu den eher wenig sensitiven etablierten Markern können damit Veränderungen viel früher erfasst werden. Die nächsten Ziele sind die Validierung hinsichtlich prognostischer Aussagekraft und anschließend der Versuch, hierdurch auch neue Targets zu identifizieren.

Ein weiteres Projekt, das Langs als Beispiel anführte, befasst sich mit der Vorhersage des Ansprechens auf eine neoadjuvante Chemotherapie bei Brustkrebs: Über einen Vergleich von pre-treatment zu early-treatment imaging sind Zeitketten darstellbar. Die Veränderungen über die Zeit können genaue Aussagen liefern, was während der Behandlung mit dem Gewebe passiert. So kann schon früh sichtbar gemacht werden, ob die Behandlung funktioniert und wie die Veränderung im Tumor aussehen kann. Dadurch könnten auch Mechanismen für neue Therapien identifiziert werden. Ein anderer großer Anwendungsbereich ist laut Langs der Einsatz von large language models, um strukturierte Patientenpfade/Behandlungspfade aus großen Mengen unstrukturierter Patientendaten zu erstellen.

Vom Mysterium zur Meisterschaft

Zori Cheshmedzhieva, Vice President Global Clinical Development bei Celerion, erläuterte in ihrem Vortrag „From Mystery to Mastery – AI in Clinical Trials“, dass KI neue Felder eröffne, ihr Einsatz aber wohlüberlegt stattfinden müsse. So machte sie beispielsweise darauf aufmerksam, dass die Verwendung von KI – oder AI für Artificial Intelligence – Einfluss auf das menschliche Gehirn und dadurch auf unser Denken und Handeln habe. Auch wenn KI uns viel „Detail- und Sucharbeit“ ersparen kann und die rasche Analyse riesiger Datenmengen ermöglicht, sollten wir uns bewusst sein, dass ein zu exzessiver Einsatz von KI unser eigenes Erinnerungsvermögen schwächen und unsere Fähigkeit zum unabhängigen kritischen Denken beeinträchtigen könne, so Cheshmedzhieva. Wie so oft kommt es daher auch bei der Verwendung von KI auf den Kontext und die „richtige Dosis“ an.

Betrachtet man den Einsatz von KI im Bereich klinischer Forschung, sieht Cheshmedzhieva vielfältige Einsatzmöglichkeiten für Sponsoren, Prüfzentren und Behörden, die eine erhöhte Effizienz, ein rascheres Drug Development und insbesondere auch eine höhere Sicherheit für die Patient:innen ermöglichen. Ein wesentlicher Benefit ist für sie auch die Patientenrekrutierung, denn KI kann durch Screening vorhandener Daten potenziell geeignete Patient:innen identifizieren und bereits vorab auf Einschluss- und Ausschlusskriterien überprüfen, wodurch die Rekrutierung beschleunigt würde. Weitere Bereiche, in denen der Einsatz von KI einen wesentlichen Beitrag leisten könnte, sind für Cheshmedzhieva Remote Monitoring, Datenanalyse aus Wearables und Health Apps, Erstellen von Studienprotokollen und Unterlagen für Patient:innen, Generierung strukturierter Studienreports aus den erfassten Daten inklusive Qualitätskontrolle komplexer Datensätze und Signal Detection hinsichtlich Wirksamkeit und Safety/Toxizität. Idealerweise sollte dies die Datenintegrität verbessern und somit zu einer höheren Verlässlichkeit führen sowie den Review und auch die Entscheidungsfindung erleichtern und beschleunigen.

Gleichzeitig sind jedoch zahlreiche zentrale Limitationen der zugrunde liegenden Modelle zu beachten, so z.B. ein algorithmischer Bias aufgrund nicht repräsentativer Trainingsdaten. Dazu kommen kritische Aspekte wie eingeschränkte Erklärbarkeit der ­Modelle, Reproduzierbarkeit und auch Haftungsfragen. Cheshmedzhieva sieht den Einsatz von KI im Bereich Forschung daher durchaus positiv, betonte aber abschließend, man müsse Innovation und Ethik aufeinander abstimmen und miteinander in Einklang bringen.

Regulatorische Bestimmungen

Im dritten und letzten Vortrag der Veranstaltung widmete sich Tobias Fellinger, BASG/AGES, unter dem Titel „Regulatory Perspectives: AI Guidance Development & EMA Re­flection Paper“ den aktuellen Richtlinien sowie den dahinterliegenden Grundsätzen.
Auch er unterstrich, dass der Einsatz von KI und Machine Learning (ML) helfen könne, Daten auch im Bereich medizinischer Therapien/Produkte grundsätzlich effektiver zu generieren, transformieren, analysieren und zu interpretieren. Entscheidend sei laut Fellinger die Validität des zugrunde liegenden Modells. Dabei seien der jeweilige Kontext und die Auswirkungen potenzieller Fehler immer speziell zu bedenken, betonte er. Das Reflection Paper fordert daher einen strikten risikobasierten Ansatz für die Entwicklung, die Bereitstellung und das Perfomance Monitoring solcher Tools. Dazu gehört u.a. eine genaue Definition des Kontextes, in dem das KI-Tool eingesetzt werden soll, um auf dieser Basis die Entwicklung und Validierung korrekt durchführen zu können. Spezielle Anforderungen gibt es an die Datengrundlage, denn die Trainingsdaten sind absolut entscheidend für das „Verhalten“ des Tools. Hierzu zählen eine genaue Dokumentation der Datenquellen und des Daten-Cleanings sowie die saubere Trennung von Testdaten und Trainingsdaten. Für High-Risk-Anwendungen wird ein prospektiv erhobener Test-Datensatz empfohlen, erklärte Fellinger.Beim Performance Assessment sind passende Metriken sowie Sensitivitätsanalysen – etwa bezüglich Zeittrends zwischen alten Trainingsdaten und aktueller Anwendung – zentral. Transparente Modelle wären hinsichtlich Interpretierbarkeit und Erklärbarkeit wünschenswert, meist handle es sich aber um „Black Box“-Modelle; deshalb sollten zumindest erklärbare KI-Techniken eingesetzt werden. Für das Performance Monitoring sind festgelegte Kriterien notwendig, zudem müssen Veränderungen in Behandlungsalgorithmen berücksichtigt und die ­Validität gegebenenfalls neu bewertet werden. Ein Risiko-Minimierungsplan inklusiver kla­rer Abbruchkriterien für die Modellan­wen­dung ist laut Fellinger unerlässlich. Die Anforderungen variieren je nach Produktlebenszyklus und Risiko für die Patient:innen bzw. regulatorischen Vorgaben. Nach der Zulassung könnten KI/ML-Tools zur Signal Detection, etwa in PASS/PAES-Studien oder generell zur Analyse der Pharmakovigilanzdaten, wertvolle Unterstützung bieten, so Fellinger abschließend.

Fazit

KI bietet eine wertvolle Entscheidungshilfe bzw. ermöglicht eine erweiterte Entscheidungsgrundlage. Die finale Entscheidung muss aber immer noch der Mensch treffen. In Zukunft können durch den Einsatz von KI Verbesserungen für Patient:innen erzielt werden, wie z.B. neue oder verbesserte Pro­gnosemarker und Hypothesen-generierende Ansätze für neue Targets. Doch die verwendeten KI-Tools müssen – so wie alle Maßnahmen in der Medizin – über Studien verifiziert werden.