Robustes BERT-Modell extrahiert Krebserkrankungen aus Pathologieberichten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Studie wurde ein hochpräzises System entwickelt, das spezifische Krebsarten aus unstrukturierten Pathologieberichten automatisch extrahiert. Das System basiert auf einem feinjustierten RoBERTa-Modell, das speziell für die medizinische Domäne angepasst wurde.

Die Ergebnisse sind beeindruckend: Der F1‑Bertscore liegt bei 0,98 und die exakte Übereinstimmung der extrahierten Daten erreicht 80,61 %. Damit übertrifft das Modell sowohl die herkömmliche Baseline als auch das große Sprachmodell Mistral 7B deutlich.

Die Feinabstimmung von domänenspezifischen Modellen zeigt ein enormes Skalierungspotenzial und lässt sich nahtlos in den Prozess des molekularen Tumorboards integrieren. Damit eröffnet sich die Möglichkeit, klinische Informationen effizienter und genauer zu extrahieren und die Präzisionsmedizin weiter voranzutreiben.

Ähnliche Artikel