Der Einsatz von künstlicher Intelligenz wird zunehmend als Unterstützung bei der Diagnose von Hauttumoren diskutiert. Eine aktuelle multizentrische Studie, die im Fachjournal JAMA Dermatology veröffentlicht wurde, untersuchte nun, wie sich moderne KI-Systeme im Vergleich zu Ärzt:innen mit unterschiedlichem Erfahrungsgrad bei der Beurteilung von Hautläsionen schlagen.
Für die Analyse wurde ein Datensatz mit 1.117 alltäglichen dermatologischen Fällen verwendet, der klinische und dermatoskopische Bilder mit zugehörigen Metadaten umfasste, darunter auch seltene und atypische Hautveränderungen. Insgesamt nahmen 652 Ärzt:innen mit unterschiedlicher dermatologischer Erfahrung an der Studie teil. Zusätzlich wurden 3 KI-Modelle getestet: ein konventionelles neuronales Netzwerk der ersten Generation sowie 2 moderne KI-Modelle, die auf große Bilddatensätze vortrainiert wurden. Die höchste diagnostische Genauigkeit erreichten Dermatolog:innen mit mehr als 10 Jahren Berufserfahrung. Mit einer Trefferquote von 74,2 % übertrafen sie alle untersuchten KI-Systeme. Das leistungsstärkste KI-Modell erzielte eine Genauigkeit von 72,2% und schnitt damit besser ab als Ärzt:innen mit weniger als 3 Jahren Erfahrung, gleichzeitig blieb es Dermatolog:innen mit mehr als 10 Jahren Berufserfahrung unterlegen. Hinsichtlich der Genauigkeit bei der korrekten Diagnose von Hautläsionen erreichte das beste KI-Modell das Niveau von Dermatolog:innen mit 3 bis 10 Jahren Erfahrung. Die Ergebnisse verdeutlichen damit sowohl das Potenzial als auch die aktuellen Grenzen der künstlichen Intelligenz in der Dermatologie.