Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “ranking”
Forschung

<h1>Diffusion-MPC in Tetris: Feasibility, Horizon und Kritiker-Alignment analysiert</h1> <p>Forscher haben Diffusion‑basierte Model Predictive Control (Diffusion‑MPC) in einem diskreten, kombinatorischen Umfeld untersucht – konkret im beliebten Spiel Tetris. Dabei wird ein MaskGIT‑ähnlicher Diskret‑Denoiser eingesetzt, um mögliche Platzierungssequenzen zu generieren, und anschließend werden die Kandidaten durch ein Reranking ausgewählt.</p> <p>Die Studie beleuchtet drei zentrale Aspekte: Erstens die Notwend

arXiv – cs.LG
Forschung

<h1>LLM‑Reranker: Verhalten unter festen Evidenzpools diagnostiziert</h1> <p>Forscher haben ein neues Diagnoseverfahren entwickelt, das das Ranking‑Verhalten großer Sprachmodelle (LLMs) isoliert, indem feste Evidenzpools verwendet werden.</p> <p>In herkömmlichen Reranking‑Tests werden die Ergebnisse von Retrieval‑ und Ranking‑Algorithmen miteinander vermischt, sodass Unterschiede nicht eindeutig dem Ranking‑Verhalten zugeschrieben werden können.</p> <p>Die neue Methode nutzt Multi‑News‑Cluster als feste Evi

arXiv – cs.LG
Forschung

<p>LLM-basierte Rangliste optimiert Review-Verteilung an ML-Konferenzen</p> <p>Eine neue Studie schlägt vor, dass große Machine‑Learning‑Konferenzen die begrenzte Review‑Kapazität gezielt auf diejenigen Papers konzentrieren sollten, die sich am Annahme‑Grenzbereich befinden. Statt zufälliger oder affinitätsbasierter Zuweisungen wird hier ein systematischer Ansatz präsentiert, der die Effizienz des Review‑Prozesses deutlich steigert.</p> <p>Der Kern der Methode ist ein LLM‑gestütztes Vergleichs‑Ranking, das

arXiv – cs.AI