Neues RAGsemble-Framework verbessert Extraktion von Industrie-Teilspezifikationen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer wegweisenden Studie präsentiert ein neues Retrieval‑Augmented Multi‑LLM Ensemble, das die Extraktion von Teilspezifikationen aus unstrukturiertem Text in der Industrie revolutioniert. Das System, genannt RAGsemble, koordiniert neun hochmoderne Large Language Models – darunter Gemini 2.0, 2.5, 1.5, OpenAI GPT‑4o, o4‑mini, Mistral Large sowie Gemma 1B, 4B und 3n‑e4b – in einem strukturierten, dreiphasigen Pipeline‑Ansatz.

Der Prozess beginnt mit einer parallelen Extraktion durch die verschiedenen Modelle, gefolgt von einer gezielten Forschungs‑Augmentation, die die leistungsstärksten Modelle nutzt. Anschließend erfolgt eine intelligente Synthese, bei der Konflikte gelöst und die Ergebnisse anhand von Vertrauenswerten gewichtet werden. Durch die Integration von FAISS‑basierter semantischer Retrieval‑Technologie hat RAGsemble Echtzeit‑Zugriff auf strukturierte Teildatenbanken, wodurch die Ausgaben validiert, verfeinert und mit relevanten Referenzen angereichert werden.

Experimentelle Tests mit realen Industrie‑Datensätzen zeigen, dass RAGsemble die Genauigkeit, technische Vollständigkeit und die Qualität strukturierter Ausgaben deutlich über den führenden Single‑LLM‑Baselines hinaus steigert. Die Arbeit liefert eine skalierbare Ensemble‑Architektur, nahtlose RAG‑Integration, umfassende Qualitätsbewertung und eine produktionsbereite Lösung – ein bedeutender Fortschritt für die Automatisierung von Beschaffungs‑ und Wartungsprozessen.

Ähnliche Artikel