KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “ToolBench”

KI-Agenten meistern Budgetbeschränkungen: INTENT-Planung für kostengünstige Tool‑Nutzung

In einer neuen Studie auf arXiv wird gezeigt, wie große Sprachmodelle unter strengem Geldbudget arbeiten können, indem sie externe Tools ge…

arXiv – cs.AI 13.02.2026 05:00

SWIRL: Selbstverbessernde Weltmodellierung ohne Aktionsdaten

Ein neues Forschungsprojekt namens SWIRL (Self‑Improving World Modelling with Latent Actions) zeigt, wie große Sprach‑ und Bildmodelle ihre…

arXiv – cs.AI 09.02.2026 05:00

KI-Modelle verbessern Funktionsaufrufe dank eingebetteten Denkprozesses

Neues Forschungspapier aus dem arXiv-Repository präsentiert einen innovativen Ansatz zur Steigerung der Genauigkeit von Funktionsaufrufen i…

arXiv – cs.AI 27.01.2026 05:00

Stealth-Attacke: LLM-Agenten kosten explodieren durch heimliche Tool-Ketten

Eine neue Studie aus dem arXiv-Repository hat gezeigt, dass moderne Large Language Model (LLM)-Agenten durch eine heimliche, mehrstufige An…

arXiv – cs.AI 19.01.2026 05:00

<p>Large Language Models (LLMs) stoßen häufig an die Grenze ihres „Wissens-Cutoffs“, weil ihre festgelegten Parameter keine neuen Informationen direkt aufnehmen können. Traditionell wird dafür Supervised Fine‑Tuning (SFT) eingesetzt, das zwar Fakten aktualisiert, aber selten die Fähigkeit verbessert, diese neuen Daten in Antworten oder Entscheidungen zu nutzen.</p>

Reinforcement Learning (RL) kann hingegen das nötige Denkvermögen vermitteln, ist jedoch wegen des hohen Rechenaufwands kaum für schnelle O…

arXiv – cs.LG 19.01.2026 05:00

Kleine Sprachmodelle schlagen große Modelle bei gezieltem Feintuning

Mit zunehmender Verbreitung generativer KI wird die Kostenoptimierung von Modellen zu einem entscheidenden Faktor für Nachhaltigkeit und Zu…

arXiv – cs.AI 19.12.2025 05:00

Planner‑Centric Framework überwindet ReAct: LLMs meistern komplexe Tool‑Workflows

Ein neues Forschungsprojekt aus dem Bereich der großen Sprachmodelle (LLMs) präsentiert ein innovatives Planner‑Centric Framework, das die…

arXiv – cs.AI 14.11.2025 05:00