Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Q-Learning”
Forschung

Sicherheitsorientiertes Q‑Learning: Expertenbeispiele bei unbekannten Beschränkungen In einer neuen Studie aus dem Bereich der künstlichen Intelligenz wird gezeigt, wie Agenten aus sicheren Demonstrationen lernen können, selbst in Umgebungen mit unbekannten Beschränkungen zu agieren. Das Ziel ist es, eine Politik zu entwickeln, die die Wahrscheinlichkeit von sicheren, aber gleichzeitig lohnenden Handlungen maximiert. Der Ansatz, der als SafeQIL (Sicheres Q‑Inverse Konstrahiertes Verstärkungslernen) bezeic

arXiv – cs.LG
Forschung

<p>Wie die Update‑Frequenz von Zielnetzwerken Q‑Learning optimiert</p> <p>Eine neue Veröffentlichung auf arXiv beleuchtet ein zentrales Stabilisierungselement des (deep) Q‑Learning: die Häufigkeit, mit der das Zielnetzwerk aktualisiert wird. Trotz seiner Bedeutung bleibt die Wahl dieser Frequenz oft ein rein hyperparameter‑basiertes Experiment, ohne klare theoretische Grundlage.</p> <p>Die Autoren führen eine gründliche Analyse im tabellarischen Q‑Learning durch und betrachten periodische Zielupdates als ve

arXiv – cs.LG