Brustkrebs: Diagnose mit Deep Learning


26.05.2025

Brustkrebs: Deep Learning könnte frühere Diagnose ermöglichen


Switch to English
 

Es ist ein Ziel vieler Mediziner:innen, Brustkrebs möglichst früh zu erkennen. Denn je eher die Erkrankung behandelt wird, umso mehr Todesfälle lassen sich verhindern. Mit Hilfe von EuroCC Austria entwickelt das österreichische Start-up Salataris AI ein Deep-Learning-Modell, das Expert:innen unterstützt, Tumore möglichst früh zu erkennen. Das Modell lernt an Mammographie- und MRT-Bildern, auch kleine und seltene Tumoren zu erkennen.

Bettina Benesch

Brustkrebs ist die häufigste Krebserkrankung bei Frauen – und auch Männer sind betroffen; mit etwa einem Prozent aller Fälle zwar deutlich seltener, aber doch. In Europa erkranken jährlich rund 660.000 Menschen an einem bösartigen Tumor der Brust; das entspricht ungefähr der Einwohnerzahl Luxemburgs. 156.000 Personen versterben pro Jahr an dieser Krebserkrankung. Vergleichen wir wieder mit Einwohnerzahlen, ist das in etwa die Bevölkerung von Heidelberg in Deutschland. All das durch ein paar wenige abtrünnige Zellen. Könnte man diese früher und besser detektieren als bisher, würden allein ein Europa tausende Menschenleben gerettet.

Genau hier möchte das österreichische Start-up Salataris AI einen Beitrag leisten: Unterstützt von EuroCC Austria entwickelt das Team ein KI-Modell, um Brustkrebs in Mammographie- und Magnetresonanztomografie-Bildern (MRT) zu erkennen. Der erste Schritt in diese Richtung ist das Verbessern des Bildmaterials. Denn Mammographie- oder MRT-Bilder enthalten immer wieder sogenannte Artefakte: Störungen im Bild, wie fleckenartige Muster oder feinkörniges Rauschen, die die Diagnose erschweren.


Weniger falsch positive und falsch negative Befunde durch KI-Modell


Wer veränderte Zellen und Tumoren mit hoher Genauigkeit erkennen möchte, muss das Rauschen aus den Bildern entfernen und Bildqualität sowie Kontrast verbessern. Die höhere Bildqualität ermöglicht es dem KI-Modell, bessere Ergebnisse zu liefern und trägt so dazu bei, das Risiko falsch negativer und falsch positiver Ergebnisse zu senken. Als falsch negativ wird ein Befund bezeichnet, der keine Erkrankung erkennt, obwohl diese vorliegt. Der Tumor wird also übersehen. Aber auch falsch positive Befunde sind nichts, was sich Patient:innen wünschen: Hier wird ein Tumor diagnostiziert, den es gar nicht gibt. Bei jedem (falsch) positiven Befund wird eine Gewebeprobe entnommen und untersucht. Dieser Prozess kostet Zeit und Geld, und schürt viele Ängste – die im Fall eines tatsächlich negativen Befundes gar nicht erst entstehen hätten müssen. 

Einsatz in Krankenhaussoftware für bessere Diagnostik


Salataris AI setzt auf Deep Learning (eine Unterkategorie von KI) und ist derzeit mitten im Trainingsprozess seines Modells: Es lernt an großen Mengen von Mammographie- und MRT-Bildern, um Tumoren sicher zu erkennen. Am Ende des Projekts soll es über eine digitale Schnittstelle (API) leicht in andere Programme eingebaut werden können. Außerdem ist geplant, es direkt auf kleinen, leistungsfähigen Geräten laufen zu lassen – etwa auf einem NVIDIA Jetson (ein Mini-Computer für Künstliche Intelligenz/KI) oder einem sogenannten Field Programmable Gate Array (kurz FPGA, ein sehr flexibler, programmierbarer Chip). Auf diese Weise kann es relativ einfach zum Beispiel in Krankenhaussoftware eingesetzt werden.

 

Am Ende des Projekts soll das Diagnosewerkzeug über eine digitale Schnittstelle leicht in andere Programme eingebaut werden können. So ließe sich Krankenhaussoftware um eine neue Funktion erweitern.

 

 

Verschiedene Ansätze verbessern Lernleistung des Modells


Während des Trainings geht es darum, verschiedene Modelle zu testen und deren Lernleistung immer weiter zu optimieren. Dies wird als Hyperparameter Optimisation (HPO) bezeichnet: Die Entwickler:innen suchen nach der optimalen Konfiguration des Modells und des Trainings. Weil man dabei viel probieren muss, braucht es große Rechenleistung, und genau diese liefert ein Supercomputer. Mit ihm lassen sich gleichzeitig verschiedene Konfigurationen testen, und am Ende bleibt das beste Modell über. Dazu arbeitet das Team mit verschiedenen Ansätzen gleichzeitig:

  • Unüberwachte Lernalgorithmen, um Bildrauschen zu entfernen, Bilder zu verbessern und versteckte Informationen bei seltenen oder abnormalen Fällen zu entdecken. Unüberwachtes Lernen bedeutet: Das Modell erkennt Muster, ohne die richtigen Antworten zu erhalten (z. B. dichtes Gewebe = Tumor), aus denen es lernen kann.

  • Überwachtes und halbüberwachtes Lernen. Überwachtes Lernen verwendet etikettierte Daten (z. B. „dieses Bild enthält einen Tumor“), um gezielt zu lernen. Halbüberwachtes Lernen kombiniert überwachtes und unüberwachtes Lernen.

  • Manifold Learning. Hier wird nach verborgenen Strukturen in komplexen Daten gesucht. Ein Manifold ist eine mathematische Struktur, mit der man sich vorstellen kann, dass komplexe, hochdimensionale Daten eigentlich auf einer glatten Fläche liegen, wie zum Beispiel eine Zeichnung auf einem zusammengeknüllten Blatt Papier: eine zweidimensionale Fläche, die sich nur im Raum verbogen hat. Umgelegt auf Deep Learning bei der Tumorerkennung heißt das: Ein MRT-Bild hat Millionen Pixel, und jedes dieser Pixel ist mit einem anderen verbunden; es gibt Muster, Formen oder Grenzen, wie etwa Tumorränder. Entwickler:innen gehen davon aus, dass diese Bilder alle einer versteckten Struktur (dem Manifold) folgen – also dass z. B. alle Bilder mit Tumor ähnliche Merkmale haben, und diese auf einem bestimmten „Teil“ des Manifolds liegen. Das Ziel des Modells ist es, diese Struktur zu lernen und sie zu nutzen, um Zellveränderungen besser zu erkennen.

  • Kontrastives Lernen. Diese Art zu lernen hilft, besonders gut zwischen ähnlichen und unähnlichen Fällen zu unterscheiden.

  • Selbstanpassendes Lernen. Selbstanpassendes Lernen bedeutet, dass das Modell sich laufend neuen Daten oder Bedingungen anpasst. Es lernt weiter, während es arbeitet und kann jede Lernart enthalten, also überwachtes, halbüberwachtes oder unüberwachtes Lernen. Es hilft, die Erkennungsgenauigkeit des KI-Modells weiter zu verbessern.

  • Verstärkungslernen durch Belohnung: Das Modell bekommt bei korrektem Verhalten positives Feedback, bei Fehlern negatives, und lernt daraus. Auch hier geht es darum, das Modell Tumoren erkennen zu lassen, aber zum Beispiel auch Artefakte.


Künstliche Intelligenz zur Bilderkennung braucht immer viel Rechenleistung. Ein Supercomputer ist dafür perfekt: Er besteht aus vielen einzelnen Rechnern und kommt mit dem Training an ein paar Hundertausend Bildern locker klar.

 

KI und Supercomputing: schneller bessere Ergebnisse


Salataris AI trainiert sein KI-Modell am italienischen Supercomputer LEONARDO; der Zugang erfolgte über EuroCC Austria. Wird künstliche Intelligenz zur Bilderkennung trainiert, ist das immer rechenintensiv, da die einzelnen Bilddaten meist sehr groß sind und das Modell tausende von Bildern benötigt, um zu lernen und Muster zu entdecken. Hier kommt der Vorteil von so genannten High-Performance Computing-Systemen (HPC) zum Tagen: Sie bestehen aus vielen einzelnen, verbundenen Rechnern, und sind daher leistungsfähiger als ein einzelner Computer. Mit dem Training an ein paar Hundertausend Bildern kommt ein Supercomputer also locker klar. Salataris AI wollte darüber hinaus auch den Workflow auf einem HPC-System kennenlernen und erfahren, wie sich KI darauf skalieren lässt.

Um sinnvoll auf den vielen vernetzten Computern zu rechnen, braucht es die sogenannte Parallelisierung, bei der eine große Rechenaufgabe in viele kleine Teile portioniert wird, und mehrere leistungsfähige Grafikkartenprozessoren (GPUs) gleichzeitig an der jeweiligen Aufgabe rechnen. Dieser Prozess läuft nur dann rund ab, wenn man weiß, welche Tools und Techniken sinnvoll eingesetzt werden können. Daher erhalten Start-ups, die in HPC einsteigen, Hilfe von EuroCC-Austria-Expert:innen, wenn sie das wünschen.


Bildverbesserung mit Deep Learning: So geht’s. Lesen Sie mehr im nächsten Blogbeitrag


Im zweiten Teil dieser Success-Story geht es darum, wie sich die Qualität von Mammographie- und MRT-Bildern mit und ohne KI verbessern lässt, und wie Salataris AI Deep Learning genau dafür einsetzt. Ab 9. Juni 2025 hier.