Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Optimierungsprozess”
Forschung

<p>LLM-Logik neu gedacht: PoT steigert Reasoning um 50 % bei LiveCodeBench</p> <p>Ein neues Verfahren namens Policy of Thoughts (PoT) hat die Art und Weise, wie große Sprachmodelle (LLMs) komplexe, langanhaltende Aufgaben lösen, grundlegend verändert. Während herkömmliche Modelle bei tiefgreifenden Rechenaufgaben oft an ihre Grenzen stoßen, nutzt PoT die Idee, dass Intelligenz aus dem ständigen Lernen an Fehlern entsteht.</p> <p>PoT betrachtet das Denken als einen Online-Optimierungsprozess innerhalb einer

arXiv – cs.AI
Forschung

Heterogene Gegnerische Lernspiele revolutionieren KI-Training In der neuesten Veröffentlichung auf arXiv (2510.18407v1) wird ein innovatives Konzept vorgestellt, das die Art und Weise, wie KI-Agenten lernen, grundlegend verändert. Das Verfahren, genannt Heterogeneous Adversarial Play (HAP), nutzt ein dynamisches Lehrer-Schüler-Interaktionsmodell, bei dem ein automatischer Curriculum-Generator und ein lernender Agent in einem minimax‑Optimierungsprozess zusammenarbeiten. Traditionelle Self‑Play‑Methoden

arXiv – cs.AI