Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Rechenaufgabe”
Forschung

<p>Ein neues Verfahren namens Recursive Concept Evolution (RCE) verspricht, die Leistungsfähigkeit großer Sprachmodelle bei komplexen Rechenaufgaben deutlich zu erhöhen.</p> <p>Obwohl moderne LLMs bei vielen Aufgaben brillieren, verlieren sie bei Benchmark-Tests, die tiefes Zusammenspiel von Konzepten erfordern, an Genauigkeit. Dazu zählen ARC‑AGI‑2, GPQA, MATH, BBH und HLE.</p> <p>RCE erlaubt es dem Modell, während der Inferenz seine internen Repräsentationen dynamisch zu verändern, indem es neue, niedrigd

arXiv – cs.AI
Forschung

<p>LLM-Logik neu gedacht: PoT steigert Reasoning um 50 % bei LiveCodeBench</p> <p>Ein neues Verfahren namens Policy of Thoughts (PoT) hat die Art und Weise, wie große Sprachmodelle (LLMs) komplexe, langanhaltende Aufgaben lösen, grundlegend verändert. Während herkömmliche Modelle bei tiefgreifenden Rechenaufgaben oft an ihre Grenzen stoßen, nutzt PoT die Idee, dass Intelligenz aus dem ständigen Lernen an Fehlern entsteht.</p> <p>PoT betrachtet das Denken als einen Online-Optimierungsprozess innerhalb einer

arXiv – cs.AI