MuISQA: Retrieval-gestützte Mehrintentionen für wissenschaftliche Fragen
Wissenschaftliche Fragestellungen sind oft vielschichtig: Man muss nicht nur Gene mutieren, sondern auch deren Zusammenhang zu Krankheiten herausfinden. Traditionelle Retrieval‑Augmented‑Generation‑Modelle (RAG) sind dafür meist auf einen einzigen Intent ausgelegt und liefern dadurch unvollständige Belege. Das neue MuISQA‑Benchmark‑Set prüft genau diese Schwäche, indem es RAG‑Systeme auf die Abdeckung heterogener Beweismaterialien über mehrere Unterfragen hinweg testet.