Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Reranking”
Forschung

<h1>Diffusion-MPC in Tetris: Feasibility, Horizon und Kritiker-Alignment analysiert</h1> <p>Forscher haben Diffusion‑basierte Model Predictive Control (Diffusion‑MPC) in einem diskreten, kombinatorischen Umfeld untersucht – konkret im beliebten Spiel Tetris. Dabei wird ein MaskGIT‑ähnlicher Diskret‑Denoiser eingesetzt, um mögliche Platzierungssequenzen zu generieren, und anschließend werden die Kandidaten durch ein Reranking ausgewählt.</p> <p>Die Studie beleuchtet drei zentrale Aspekte: Erstens die Notwend

arXiv – cs.LG
Forschung

<h1>LLM‑Reranker: Verhalten unter festen Evidenzpools diagnostiziert</h1> <p>Forscher haben ein neues Diagnoseverfahren entwickelt, das das Ranking‑Verhalten großer Sprachmodelle (LLMs) isoliert, indem feste Evidenzpools verwendet werden.</p> <p>In herkömmlichen Reranking‑Tests werden die Ergebnisse von Retrieval‑ und Ranking‑Algorithmen miteinander vermischt, sodass Unterschiede nicht eindeutig dem Ranking‑Verhalten zugeschrieben werden können.</p> <p>Die neue Methode nutzt Multi‑News‑Cluster als feste Evi

arXiv – cs.LG