CNNs schlagen Transformer- und Mamba-Modelle bei Zahnkaries-Segmentierung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer umfassenden Vergleichsstudie wurden zwölf moderne Deep‑Learning‑Architekturen – darunter DoubleU‑Net, VMUnet, MambaUNet, TransNetR, PVTFormer und weitere – auf dem DC1000‑Datensatz für die automatische Segmentierung von Zahnkaries in Panorama‑Röntgenbildern getestet. Alle Modelle wurden unter identischen Trainingsbedingungen evaluiert, sodass die Ergebnisse direkt vergleichbar sind.

Erstaunlich zeigte sich, dass das klassische Convolutional‑Neural‑Network DoubleU‑Net die höchste Leistung erzielte: ein Dice‑Score von 0,7345, ein mIoU von 0,5978 und eine Präzision von 0,8145. Diese Werte übertrafen sämtliche Transformer‑ und Mamba‑Varianten deutlich. Die Top‑3‑Ergebnisse aller Metriken wurden ausschließlich von CNN‑basierten Architekturen erreicht.

Die Autoren erklären, dass die Transformer‑ und Mamba‑Modelle trotz ihrer theoretischen Stärke im globalen Kontext‑Modellieren bei begrenzten Datenmengen und schwächeren räumlichen Priors schlechter abschnitten. Die Studie unterstreicht damit, dass die Auswahl der Architektur stärker an der spezifischen Aufgabenstellung als an der generellen Modellkomplexität ausgerichtet sein sollte.

Der komplette Code zur Reproduktion der Experimente ist auf GitHub verfügbar: https://github.com/JunZengz/dental-caries-segmentation.

Ähnliche Artikel