KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “SOE”

Manifold-Reshaping Policy Optimization lässt LLMs über ihre Grenzen hinaus denken

Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) hat gezeigt, dass große Sprachmodelle (LLMs) ihre Fähigkeit zum logischen Den…

arXiv – cs.LG 04.02.2026 05:00

Student Guides Teacher: Spectral Orthogonal Exploration steigert LLM-Logik um 62 %

Große Sprachmodelle (LLMs) erreichen inzwischen nahezu menschliche Leistungen, doch bei komplexen mathematischen Beweisen und langfristigen…

arXiv – cs.AI 13.01.2026 05:00