M³Prune: Effizientes Graph-Pruning für Multi-Modal Multi-Agent Retrieval-Gen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues arXiv-Papier präsentiert M³Prune, ein hierarchisches Graph-Pruning-Framework, das die Kommunikation zwischen mehreren Agenten in Multi-Modal Retrieval‑Augmented Generation (mRAG) optimiert. Durch gezielte Reduktion redundanter Verbindungen zwischen Text- und Bildmodalitäten werden Token‑Kosten und Rechenaufwand drastisch gesenkt, ohne die Leistungsfähigkeit zu beeinträchtigen.

Der Ansatz beginnt mit einer intra‑modalen Graph‑Sparsifizierung, bei der die wichtigsten Kanten für jede Modalität identifiziert werden. Anschließend wird ein dynamisches Inter‑Modal‑Netzwerk aufgebaut, das auf diesen Schlüsselverbindungen basiert. Durch schrittweises Pruning werden überflüssige Kanten entfernt, sodass ein kompakteres, hierarchisches Topology entsteht, das effizienter kommuniziert.

Umfangreiche Tests auf allgemeinen und domänenspezifischen mRAG‑Benchmarks zeigen, dass M³Prune sowohl einzelne Agenten als auch robuste Multi‑Agent‑Systeme übertrifft. Gleichzeitig reduziert es den Token‑Verbrauch erheblich, was die Skalierbarkeit großer, multimodaler Sprachmodelle deutlich verbessert.

Ähnliche Artikel