KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “HotpotQA”

PseudoAct: Pseudocode‑Synthese ermöglicht flexible Planung in LLM‑Agenten

In der Welt der großen Sprachmodelle (LLM) setzen Agenten bislang vorwiegend reaktive Entscheidungsparadigmen wie ReAct ein. Diese wählen A…

arXiv – cs.AI 02.03.2026 05:00

Autonome Speicheragenten: KI sammelt, prüft und nutzt Wissen selbstständig

In einer neuen Studie auf arXiv wird ein innovativer Ansatz vorgestellt, der große Sprachmodelle (LLMs) durch autonome Speicheragenten deut…

arXiv – cs.AI 27.02.2026 05:00

<p>LLM-Agenten liefern inkonsistente Ergebnisse – Konsistenz entscheidet</p> <p>Eine neue Studie mit 3.000 Agentenläufen auf der HotpotQA‑Plattform hat gezeigt, dass große Sprachmodelle wie Llama 3.1 70 B, GPT‑4o und Claude Sonnet 4.5 nicht immer das gleiche Verhalten zeigen, wenn sie dieselbe Aufgabe zweimal ausführen. ReAct‑basierte Agenten produzieren durchschnittlich 2,0 bis 4,2 unterschiedliche Aktionsketten pro zehn Durchläufe, obwohl die Eingaben identisch sind.</p> <p>Die Ergebnisse sind nicht nur ü

arXiv – cs.AI 13.02.2026 05:00

LLM-Fehler frühzeitig erkennen: Instabilitätssignal vorhersagt Ausfälle

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wird gezeigt, dass Fehler bei der Beantwortung von Fragen d…

arXiv – cs.AI 04.02.2026 05:00

Neues Chunking-Verfahren verbessert Retrieval-Augmented Generation um 12 %

In der Welt der Retrieval-Augmented Generation (RAG) stellt die Fragmentierung von Wissen über mehrere Dokumente hinweg ein großes Problem…

arXiv – cs.AI 12.01.2026 05:00

SEAL‑RAG: Ersetzen statt Erweitern steigert Multi‑Hop RAG Genauigkeit

Retrieval‑Augmented Generation‑Systeme (RAG) stoßen bei mehrstufigen Fragen häufig an ihre Grenzen, wenn die erste Suche das notwendige Bin…

arXiv – cs.AI 12.12.2025 05:00

Kompakte Modelle meistern Suchaufgaben: Orion zeigt, dass Lernen reicht

Die Suche nach relevanten Informationen muss mehr als nur Mustererkennung sein – sie erfordert das Durchdenken von Teilbeweisen und das Anp…

arXiv – cs.AI 12.11.2025 05:00

DMA: Echtzeit-Feedback für Retrieval‑augmented Generation

In der Welt der Retrieval‑augmented Generation (RAG) beschränken sich viele Systeme bislang auf statische Abrufmechanismen, was die Anpassu…

arXiv – cs.AI 10.11.2025 05:00

Selbstkonsistenz bei LLMs: Mehr Sampling bringt nur begrenzte Vorteile

Eine neue Untersuchung auf arXiv (2511.00751v1) beleuchtet die Wirkung von vermehrtem Sampling bei der Selbstkonsistenz von großen Sprachmo…

arXiv – cs.AI 05.11.2025 05:00