Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “IGM”
Forschung

Neue interaktive Benchmarks: So testen wir KI wirklich<br/><p>Standard-Benchmarks werden zunehmend unzuverlässig, weil sie gesättigt, subjektiv und schlecht generalisierbar sind. Aus diesem Grund stellen die Autoren des arXiv‑Papiers (2603.04737v1) ein neues Evaluationsparadigma vor: Interaktive Benchmarks. Dabei wird die Fähigkeit eines Modells gemessen, aktiv Informationen zu beschaffen und damit seine Intelligenz zu demonstrieren.</p><p>Das Konzept umfasst zwei Hauptbereiche. In „Interactive Proofs“ arbe

arXiv – cs.AI
Forschung

<p>Temporal imbalance erklärt Bias bei Class-Incremental Learning</p> <p>Mit der zunehmenden Verbreitung von Deep‑Learning in Bildverarbeitungsaufgaben gewinnt das Paradigma des Class‑Incremental Learning (CIL) immer mehr an Bedeutung. Dabei steht die Herausforderung des „catastrophic forgetting“ im Fokus: Modelle neigen dazu, neue Klassen zu bevorzugen und die Leistung auf älteren Klassen zu verlieren. Bisher wurde dieser Bias vor allem auf ein Ungleichgewicht innerhalb einzelner Aufgaben zurückgeführt und

arXiv – cs.LG
Forschung

<h1>Higgs-RAG: Vollständige Optimierung für Unternehmens‑Retrieval‑Generierung</h1> <p>Die Integration von Large Language Models (LLMs) in unternehmensweite Wissensmanagement‑Systeme wird durch das Retrieval‑Augmented Generation (RAG)-Paradigma vorangetrieben. Dabei wird die parametrierte Gedächtnis‑Kapazität durch externe, nicht‑parametrische Daten ergänzt. Der Sprung von Prototyp zu produktionsreife RAG‑Systeme bleibt jedoch durch drei zentrale Probleme blockiert: niedrige Abruf‑Präzision bei komplexen An

arXiv – cs.AI
Forschung

<h1>Multi-Agent-Training verbessert Produktforschung im E‑Commerce</h1> <p>Large Language Model (LLM)-basierte Agenten zeigen großes Potenzial für die konversationelle Einkaufsunterstützung, doch bisherige Systeme fehlen oft die nötige Tiefe und Kontextbreite, um komplexe Produktrecherchen durchzuführen. Gleichzeitig liefert das Deep‑Research-Paradigma zwar umfangreiche Informationen für die Websuche, stößt aber bei der Übertragung auf den E‑Commerce-Bereich auf erhebliche Lücken.</p> <p>Mit dem neuen Ansat

arXiv – cs.AI