OpenBioLLM: Open‑Source Multi‑Agent System übertrifft GeneGPT bei Genomfragen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die Beantwortung komplexer Fragen zu Genomen erfordert oft tiefgreifendes logisches Denken und die Integration zahlreicher biomedizinischer Datenquellen. GeneGPT hatte dieses Problem mit einer Kombination aus domänenspezifischen APIs und dem proprietären Modell code‑davinci‑002 von OpenAI angegangen. Doch die Abhängigkeit von einem geschlossenen System schränkte die Skalierbarkeit ein, erhöhte die Betriebskosten und wirft Fragen zum Datenschutz und zur Generalisierbarkeit auf.

In einer Pilotstudie wurde GeneGPT mit Open‑Source‑Modellen wie Llama 3.1, Qwen2.5 und Qwen2.5 Coder in einer monolithischen Architektur reproduziert. Diese Umsetzung zeigte die Grenzen des Ansatzes deutlich auf und legte die Basis für einen Weiterentwicklungsweg.

Aufbauend auf diesen Erkenntnissen entstand OpenBioLLM – ein modularer Multi‑Agent-Framework, das GeneGPT erweitert, indem es spezialisierte Agenten für Tool‑Routing, Anfrage‑Generierung und Antwort‑Validierung einführt. Durch koordinierte Entscheidungsprozesse und rollenbasierte Aufgabenverteilung erreicht OpenBioLLM über 90 % der Benchmark‑Aufgaben gleichwertig oder besser als GeneGPT.

Die Leistungskennzahlen liegen bei durchschnittlichen 0,849 für Gene‑Turing und 0,830 für GeneHop, und das alles mit kleineren Open‑Source‑Modellen ohne zusätzliche Feinabstimmung oder tool‑spezifisches Pre‑Training. Gleichzeitig reduziert die modulare Multi‑Agent‑Architektur die Latenz um 40 – 50 % und steigert die Effizienz, ohne die Modellfähigkeit zu beeinträchtigen.

Die umfassende Evaluation unterstreicht das enorme Potenzial von Open‑Source‑Multi‑Agent‑Systemen für die genomische Frage‑Antwortung. Der komplette Code und die zugehörigen Ressourcen stehen unter https://github.com/ zur Verfügung.

Ähnliche Artikel