Neurale Netzwerke: Entscheidungshilfe in der Dermatoskopie durch automatisierte Bildsuche

Tschandl P, Argenziano G, Razmara M, Yap J, Diagnostic Accuracy of Content Based Dermatoscopic Image Retrieval with Deep Classification Features. Br J Dermatol 2018 Sep 12. DOI: 10.1111/bjd.17189

 

Artifizielle Intelligenz umfasst eine Vielzahl von Bereichen, unter anderem „machine learning“, welches wiederum in viele unterschiedliche Techniken unterteilt wird. Eine davon, die zwar bereits seit einigen Jahrzehnten bekannt ist, aber in den letzten Jahren deutliche Fortschritte erfahren hat, ist die Sparte der „neuralen Netzwerke“.1 Durch die effiziente Nutzung sogenannter „convolutional filters“, welche die notwendigen Berechnungsschritte verringern, können „Convolutional Neural Networks“-(CNNs-)Architekturen nun effizient das Erkennen von visuellen Strukturen wie Linien, Farben und zusammenhängende Muster erlernen.
Wir haben in einer rezenten Publikation gezeigt, dass automatische Diagnosen von CNNs eine ähnliche diagnostische Genauigkeit wie Menschen haben können.2 Die Ausgabe eines solchen Netzwerks ist allerdings nicht sehr informativ, sondern gibt einem lediglich Wahrscheinlichkeitswerte für bestimmte Diagnosen von einem Bild – z. B. 39 % Melanom, 15 % Nävus, 46 % seborrhoische Keratose. Solche Werte erreichen wohl in experimentellen Studien gute diagnostische Werte, sind aber als Diagnoseunterstützung eines Arztes in der Praxis vermutlich wenig hilfreich. Eine Möglichkeit, die Ausgabe eines CNNs „erklärbarer“ zu machen, ist folgende:

Automatisierte Bildsuche

Die gesammelten Werte der zuvor genannten „Filter“ in einem Netzwerk werden vor Berechnung der Wahrscheinlichkeitswerte in eine lange Reihe von Zahlen zusammengefasst (in unserem Fall 2.048 Zahlen; der sogenannte „feature vector“), in der alle visuellen Elemente eines Bildes komprimiert erfasst sind. Auch wenn man nicht genau weiß, für welches Element welche Zahl genau steht, so weiß man, dass, je ähnlicher sich die Zahlenreihen zweier Bilder sind, desto ähnlicher sehen sie sich auch. In der Abbildung sieht man ein Suchbild und darunter die ähnlichsten ­Bilder, die aus einer Datenbank von > 20.000 Bildern herausgefiltert wurden (dieses System kann man unter http://ypsono.com mit eigenen Bildern testen und verwenden).

 

 

 

Der Vorteil eines solchen Systems ist, dass man nicht blind einer Wahrscheinlichkeit vertrauen muss, sondern selbst bestimmen kann, welche Fälle am ehesten „passen“ und vermutlich die richtige Diagnose haben – fast so, als würde man selbst in einem Buch nachschlagen. Der zweite Vorteil ist, dass man sofort merkt, wenn die Bilder nicht ähnlich sind. In diesem Fall weiß man, dass man dem CNN nicht vertrauen sollte – etwas, das bei der Ausgabe von reinen Wahrscheinlichkeitswerten nicht möglich ist.

Diagnose durch Bildsuche

Um die diagnostische Genauigkeit einer automatisierten Bildsuche herauszufinden, haben wir das System an drei verschiedenen Datensätzen von dermatoskopischen Bildern trainiert und getestet. Für jedes Bild in einem Test-Datensatz haben wir jeweils die 16 ähnlichsten Bilder – mit der dazugehörigen Diagnose – automatisiert herausgefiltert. Wenn 25 % der herausgesuchten Bilder eine maligne Diagnose waren, haben wir für das Testbild „maligne“ als Vorhersage angenommen. Im größten Datensatz (> 16.000 Bilder mit 8 Diagnosen) erreichte man mit dieser Vorgehensweise eine Sensitivität von 87,4 % bei einer Spezifität von 63,9 %. Die AUC zum Finden maligner Hauttumoren war 0,852 und unterschied sich nicht von der AUC, wenn man wie gewöhnlich die Wahrscheinlichkeitswerte zur Diag­nose heranziehen würde (AUC: 0,847; p = 0,456).

Fazit

Neurale Netzwerke eigenen sich nicht nur zur Anwendung als „Black Box“-Diagnosemaschine, sondern können auch eine sehr verständliche Bildsuche bieten. Das automatische Suchen von bereits wenigen Bildern erreicht im experimentellen Setting dieselbe diagnostische Genauigkeit, als würde man mit reinen „Wahrscheinlichkeitswerten“ arbeiten.

1 Alex Krizhevsky et al., Classification with deep convolutional neural networks. In NIPS, volume 1, page 4, 2012.
2 Tschandl P et al., A pretrained neural network shows similar diagnostic accuracy to medical students in categorizing dermatoscopic images after comparable training conditions. Br J Dermatol 2017; 177(3):867–9

 

Philipp Tschandl studierte Humanmedizin und Malignant Diseases im Rahmen des MD/PhD Excellence Programs an der Medizinischen Universität Wien. Er hat seine Forschungsschwerpunkte in der Hautkrebsfrüherkennung und ­automatisierter Diagnostik (ViDIR-Gruppe, Leiter: Prof. Kittler) und wurde 2017 mit 29 Jahren für das Fach Dermatologie und Venerologie habilitiert. Von 2017 bis 2018 verbrachte er einen Post-Doc-Studienaufenthalt an der School of Computing Science der Simon Fraser University in Kanada.

 

AutorIn: Priv.Doz. Dr. Philipp Tschandl, PhD

SD 04|2018

Herausgeber: Ao. Univ.-Prof. Dr. Christoph Höller, Assoc. Prof. Priv.-Doz. Dr. Constanze Jonak, Univ.-Prof. Dr. Rainer Kunstfeld, Univ.-Prof. Dr. Hubert Pehamberger
Publikationsdatum: 2018-11-22