Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Zeitbeschränkungen”
Forschung

Neue Timed Reward Machines ermöglichen präzises Timing in RL<br/><p>In der neuesten Veröffentlichung auf arXiv wird ein innovatives Konzept vorgestellt, das die Grenzen herkömmlicher Reward Machines sprengt: Timed Reward Machines (TRMs). Diese erweitern die klassische Struktur um präzise Zeitbeschränkungen, sodass Belohnungen nicht nur von vergangenen Aktionen, sondern auch von deren zeitlichem Ablauf abhängen können.</p><p>TRMs erlauben es, komplexe zeitabhängige Ziele zu formulieren – etwa Kosten für Verz

arXiv – cs.AI
Forschung

LLMs können Zeitbeschränkungen nicht zuverlässig erkennen – Studie warnt vor Einsatzrisiken Eine neue Untersuchung auf arXiv zeigt, dass große Sprachmodelle (2,8 bis 8 B Parameter) in agentischen Systemen, die in Echtzeit Entscheidungen treffen müssen, häufig nicht zuverlässig bestimmen, ob Handlungsfenster noch offen sind oder bereits abgelaufen sind. Diese Annahme, die in vielen Anwendungen als selbstverständlich gilt, wurde bislang nicht systematisch getestet. Die Forscher führten Deadline‑Detection‑

arXiv – cs.AI