Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Constraints”
Forschung

<h1>Diffusion-MPC in Tetris: Feasibility, Horizon und Kritiker-Alignment analysiert</h1> <p>Forscher haben Diffusion‑basierte Model Predictive Control (Diffusion‑MPC) in einem diskreten, kombinatorischen Umfeld untersucht – konkret im beliebten Spiel Tetris. Dabei wird ein MaskGIT‑ähnlicher Diskret‑Denoiser eingesetzt, um mögliche Platzierungssequenzen zu generieren, und anschließend werden die Kandidaten durch ein Reranking ausgewählt.</p> <p>Die Studie beleuchtet drei zentrale Aspekte: Erstens die Notwend

arXiv – cs.LG
Forschung

Sicherheitsorientiertes Q‑Learning: Expertenbeispiele bei unbekannten Beschränkungen In einer neuen Studie aus dem Bereich der künstlichen Intelligenz wird gezeigt, wie Agenten aus sicheren Demonstrationen lernen können, selbst in Umgebungen mit unbekannten Beschränkungen zu agieren. Das Ziel ist es, eine Politik zu entwickeln, die die Wahrscheinlichkeit von sicheren, aber gleichzeitig lohnenden Handlungen maximiert. Der Ansatz, der als SafeQIL (Sicheres Q‑Inverse Konstrahiertes Verstärkungslernen) bezeic

arXiv – cs.LG