OIDA‑QA: Neuer multimodaler Benchmark zur Analyse von Opioid‑Dokumenten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die Opioid‑Krise hat die Schwächen von Regulierungs­systemen, Gesundheits­praxis, Unternehmensführung und Politik aufgedeckt. Um diese Zusammenhänge zu verstehen, braucht es innovative Analyse­methoden für die riesigen Datenmengen im UCSF‑JHU Opioid Industry Documents Archive (OIDA). Der neue Ansatz strukturiert die Dokumente nach Attributen und erstellt einen Benchmark mit 400 000 Trainings‑ und 10 000 Test‑Dokumenten.

Jedes Dokument liefert reichhaltige multimodale Informationen – Text, visuelle Elemente und Layout‑Strukturen – die ein umfassendes Bild der Inhalte ermöglichen. Aus diesen Daten werden 360 000 Trainings‑ und 10 000 Test‑Frage‑Antwort‑Paare generiert. Anschließend werden domänenspezifische multimodale Large Language Models entwickelt, die zeigen, wie multimodale Eingaben die Leistung verbessern.

Ein besonderes Merkmal ist die Einbindung historischer QA‑Paare als kontextuelle Basis für aktuelle Fragen sowie die Verlinkung zu Seitenreferenzen. Dieser Ansatz liefert ein robustes, professionelles Analysewerkzeug, das die Komplexität der Opioid‑Dokumente adäquat erfasst und die Forschung in diesem kritischen Bereich vorantreibt.

Ähnliche Artikel