KI-Verifikation in der Medizin: Tool-gestütztes RL steigert Genauigkeit um 32 %

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Moderne Sprachmodelle zeigen beeindruckende Leistungen bei medizinischen Fragestellungen, doch ihre Einbindung in klinische Abläufe erfordert eine gründliche Überprüfung der Fakten. Nur so kann sichergestellt werden, dass die generierten Antworten zuverlässig und sicher sind.

Aktuelle Ansätze, die auf Reward‑Modellen basieren, liefern lediglich einen numerischen Wert zur Bewertung der Antwort, ohne eine nachvollziehbare Begründung zu geben. Zudem beschränken sie sich auf einen einmaligen Abruf aus einer Datenbank, wodurch die Möglichkeit fehlt, während des Verifizierungsprozesses zusätzliche Informationen zu holen.

Die neue Methode namens Method löst diese Schwächen, indem sie einen agentischen Rahmen schafft, der medizinische Verifikatoren dazu trainiert, während der Bewertung wiederholt externe medizinische Corpora abzufragen. Durch die Kombination von tool‑unterstützter Verifikation, einem iterativen Reinforcement‑Learning‑Paradigma und einer adaptiven Curriculum‑Strategie wird die Genauigkeit der Antworten deutlich erhöht.

In vier medizinischen Benchmark‑Tests konnte die Methode die Genauigkeit von MedQA um 23,5 % und von MedXpertQA um 32 % gegenüber dem Basis‑Generator steigern. Gleichzeitig reduziert sie den benötigten Sampling‑Budget um das Achtfache, was die Effizienz der Verifikation erheblich verbessert.

Diese Ergebnisse zeigen, dass die Einbindung dynamisch abgerufenes Evidenzmaterials ein vielversprechender Weg ist, um medizinische KI‑Systeme zuverlässiger und vertrauenswürdiger zu machen.

Ähnliche Artikel