KI in der dermatologischen Onkologie

Die Inzidenz von melanozytären und nichtmelanozytären Hautkrebsformen steigt weiterhin stetig an, und sie zählen derzeit zu den häufigsten Tumorentitäten in der kaukasischen Bevölkerung. Das Melanom ist zudem für 90 % aller Hautkrebs-Sterbefälle verantwortlich. Bei rechtzeitiger Diagnose ist bei allen Hautkrebsformen mit einer hohen Chance auf Heilung zu rechnen, sodass der Früherkennung ein besonderer Stellenwert zukommt. Neben den „klassischen“ Methoden zur Hautkrebs(früh)erkennung, wie etwa der Dermatoskopie, haben sich in den letzten Jahren zunehmend neuronale Netzwerke auf Basis künstlicher Intelligenz (KI) etabliert.1–12

Die Anzahl an Berichten zu Anwendungsmöglichkeiten künstlicher Intelligenz (KI) zur Klassifizierung unterschiedlicher benigner und maligner Hautläsionen ist in den letzten Jahren stetig gestiegen.2–12 Mehrere große internationale Studien3–6, 12 haben gezeigt, dass die KI in der korrekten Erkennung verschiedener Hautkrebsformen (melanozytär und nichtmelanozytär) erfahrenen Dermatolog:innen im experimentellen Setting überlegen sein kann. Andere Arbeiten5 unterstreichen zudem, dass die diagnostische Genauigkeit von Dermatolog:innen mit KI-Unterstützung höher ist als ohne. Der größte Nutzen zeigte sich dabei besonders bei Kliniker:innen mit weniger Erfahrung in der Dermatoskopie.

KI-unterstützte Ganzkörperfotografie

In der klinischen Praxis und in prospektiven Studien2, 7, 8 hat sich die Ganzkörperfotografie (Total Body Photography – TBP) neben der sequenziellen Videodermatoskopie als relevanter Faktor in der Früherkennung von Melanomen erwiesen. Moderne hard- und softwaregestützte TBP-Systeme nutzen mittlerweile auch die künstliche Intelligenz, um in Verlaufsbildern neue oder veränderte Läsionen automatisiert zu finden. Studien belegen, dass die diagnostische Genauigkeit von Dermatolog:innen bei der Klassifizierung von gut- und bösartigen Hautläsionen mit dieser Anwendung sowie nachgeschalteten KI-Systemen zur Analyse dermatosko­pischer Bilder verbessert werden konnte. Moderne Weiterentwicklungen der TBP ermöglichen es mittlerweile, aus multiplen Einzelbildern 3D­-A­vatare von Patient:innen zu erstellen und damit über 95 % der Körperoberfläche eines/einer Patient:in zu erfassen.9

Geräte für den/die Endnutzer:in („consumer apps“)

In den letzten Jahren wird die KI in der Medizin nicht nur in einem klinischen Setting verwendet, sondern auch zunehmend in der Laienanwendung. Sogenannte „consumer apps“ für Smartphones erfreuen sich immer größerer Beliebtheit, nicht zuletzt durch ihre einfache Handhabung und die ubiquitäre Verfügbarkeit von Smartphones. Am weitesten verbreitet sind diese Apps, wenn es um Bildinterpretationen geht, also etwa in der Dermatologie zur Hautkrebserkennung. Hinter diesen algorithmusbasierten Anwendungen stecken entsprechend angelernte, auf künstlicher Intelligenz basierende neuronale Netzwerke. Die Funktionsweise aller derzeit zugelassenen Apps zur Hautkrebsvorsorge folgt einem ähnlichen Prinzip. Dieses soll anhand der ISO-zertifizierten und als Medizinprodukt der Klasse IIb zugelassenen App SkinScreener (medaia GmbH, Graz) erläutert werden: Nutzer:innen nehmen Hautveränderungen mit der Kamera ihres Smartphones auf, die künstliche Intelligenz analysiert diese dann auf Basis ihr bekannter Muster und Strukturen. Diese Basis fußt auf mehreren Tausend Vergleichsbildern.
Anschließend erhält der/die Nutzer:in eine Risikoeinschätzung durch die App, die in der Regel dreistufig aufgebaut ist (geringes, mittleres oder hohes Risiko). SkinScreener zeigt das jeweilige Risiko mit einem leicht verständlichen 3-Farben-Code an (grün = gering; gelb = mittel; rot = hoch) (Abb.).
In einer aktuellen Studie1, welche die diagnostische Genauigkeit dieser App anhand von 1.171 gut- und bösartigen Hauttumoren untersucht hat, zeigten sich eine Sensitivität und Spezifität von jeweils weit über 90 %.

Ersetzen KI-basierte Smartphone-Apps künftig den Arztbesuch?

Das ist eine berechtigte Frage, die aber zumindest derzeit sicherlich mit „nein“ beantwortet werden kann. Der Sinn der aktuell zugelassenen Applikationen ist vielmehr, dass hiermit das Bewusstsein für eine bestimmte Erkrankung (wie etwa Hautkrebs) in der Bevölkerung geweckt wird. Dies soll dazu führen, dass sich Nutzer:innen intensiver mit möglichen Vorsorgemaßnahmen beschäftigen, um zum Beispiel Hautkrebs in frühen, meist noch kurativen Stadien zu erkennen. Neben einer Reduktion von Morbidität und Mortalität käme es so auch zu einer deutlichen Senkung der Kosten für das Gesundheitssystem, würden doch aufwendige und mitunter kostspielige Therapien seltener benötigt werden.

Status quo und Ausblick

Es ist zu erwarten, dass der Einsatz von KI in der Dermatologie weiter zunehmen wird, sodass man die Augen vor den technischen Fortschritten nicht verschließen sollte. Allerdings steht die Implementierung in den klinischen Alltag noch am Anfang. Ein wichtiger Aspekt ist, dass das individuelle Risikoprofil von Patient:innen (Hauttyp, Alter, Geschlecht, Lokalisation der Läsion) innerhalb der KI-Anwendungen selten berücksichtigt wird, um aussagekräftigere Real-­World-Daten zu generieren. Dies ist, zumindest konzeptionell, im Rahmen der TBP bereits umsetzbar, indem der Hautphänotyp analysiert und in die Klassifizierung der Läsionen integriert werden kann.
Ein bisher wenig beachteter Umstand beim Einsatz von KI zur Diagnose von Hautkrebs ist die Berücksichtigung positiver und negativer klinischer Konsequenzen von KI-unterstützten Entscheidungen aus der Sicht der Ärzt:innen und Patient:innen. In einer rezenten Studie10 wurde ein KI-System darauf trainiert, nicht nur bildbasierte Merkmale zu beachten, sondern auch die Folgen einer Fehldiagnose bei der Bewertung von gut- und bösartigen Hauterscheinungen abzuwägen, was zu einer Erhöhung des Anteils korrekter Diagnosen von 12 % führte.
Ein kritischer Punkt bei der Anwendung von KI-basierten Systemen ist die Herausforderung, dass Läsionen, Patientengruppen oder Diagnosekategorien, die nicht in den Trainingsdatensätzen vorhanden waren, möglicherweise fehlerhaft eingestuft werden. Studien zeigen, dass in solchen Fällen die diagnostische Genauigkeit der Algorithmen deutlich abnimmt und signifikant unter der der Dermatolog:innen liegt.11, 13 Daraus ergibt sich, dass die Ergebnisse der KI stets durch die menschliche Intelligenz überprüft und in den klinischen Kontext eingeordnet werden müssen.

Referenzen: (1) Kränke T et al., PLOS One 2023; 18(2):e0280670 (2) Primiero CA et al., J Invest Dermatol 2024: 144(6):1200–1207 (3) Esteva A et al., Nature 2017; 542(7639):115–8 (4) Tschandl P et al., Lancet Oncol 2019; 20(7):938–47 (5) Tschandl P et al., Nat Med 2020; 26(8):1229–34 (6) Tschandl P et al., Sci Data 2018; 5:180161 (7) Kommoss KS et al., Eur J Cancer 2023; 185:53–60 (8) Winkler JK et al., JAMA Dermatol 2023; 159(6):621–7 (9) Rayner JE et al., Front Med (Lausanne) 2018: 5:152 (10) Barata C et al., Nar Med 2023; 29:1941–6 (11) Combalia M et al., Lancet Digit Health 2022; 4(5):e330–e339 (12) Haenssle HA et al., Ann Oncol 2018; 9:1836–42 (13) Caffery LJ et al., Front Med (Lausanne) 2021; 7:619787