AutoDiscover: Kaltstart‑Lösung im aktiven Lernen mit graphbasiertem Thompson
Systematische Literaturübersichten (SLRs) sind für evidenzbasierte Forschung unverzichtbar, doch die manuelle Vorauswahl von Studien wird zunehmend zum Engpass, weil die Menge an Publikationen wächst und qualifizierte Experten knapp sind. Traditionelle aktive Lern‑(AL)‑Systeme helfen zwar, setzen aber meist auf feste Abfrage‑Strategien, die sich nicht anpassen und die Beziehungen zwischen Artikeln, Autoren und Metadaten ignorieren.
AutoDiscover stellt AL als Online‑Entscheidungsproblem dar und nutzt einen adaptiven Agenten, um die Auswahl der nächsten zu kennzeichnenden Dokumente zu steuern. Die wissenschaftliche Literatur wird als heterogenes Graphmodell aufgebaut, das Dokumente, Autoren und weitere Metadaten miteinander verbindet. Ein Heterogeneous Graph Attention Network (HAN) erzeugt für jeden Knoten eine Repräsentation, die ein Discounted Thompson Sampling (DTS) Agent verwendet, um dynamisch ein Portfolio von Abfrage‑Strategien zu verwalten. Durch Echtzeit‑Labels von menschlichen Experten balanciert der Agent Exploration und Exploitation, während sich die Nutzenwerte der Strategien im Verlauf der Review‑Dynamik verändern.
Auf dem 26‑Datensatz‑Benchmark SYNERGY übertrifft AutoDiscover die Effizienz statischer AL‑Baselines bei der Dokumentenauswahl. Besonders hervorzuheben ist die Fähigkeit des Agenten, das Kaltstart‑Problem zu lösen: Mit nur wenigen anfänglichen Labels kann AutoDiscover bereits eine effektive Entdeckungsstrategie entwickeln, während statische Ansätze in dieser Situation versagen.
Zur Transparenz und Nachvollziehbarkeit wurde TS‑Insight entwickelt – ein Open‑Source‑Dashboard für visuelle Analyse, Interpretation und Diagnose der Agentenentscheidungen. Damit können Nutzer die Auswahlprozesse nachvollziehen, die Leistung überwachen und bei Bedarf Anpassungen vornehmen, was die Akzeptanz und das Vertrauen in das System stärkt.