KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Spekulatives Decoding”

Neue LK-Verluste steigern Akzeptanzrate bei spekulativem Decoding von LLMs

Spekulatives Decoding beschleunigt die Inferenz von autoregressiven Sprachmodellen, indem ein leichtes Draft-Modell zunächst Kandidatentoke…

arXiv – cs.LG 02.03.2026 05:00

MoE‑Spec: Expertenbudgetierung steigert Effizienz von spekulativem Decoding

Die neueste Veröffentlichung auf arXiv (2602.16052v1) präsentiert MoE‑Spec, eine innovative Methode zur Optimierung des spekulativen Decodi…

arXiv – cs.LG 19.02.2026 05:00

Energieeinsparungen durch spekulatives Decoding: Benchmark-Analyse

Spekulatives Decoding hat sich als wirkungsvolle Technik etabliert, um die Latenz und die Kosten von LLM‑Inference zu senken. Trotz dieser…

arXiv – cs.LG 11.02.2026 05:00

TS-DP: Spekulatives Decoding beschleunigt Diffusion-Policy in Echtzeit

Die Diffusion Policy (DP) hat sich als leistungsstarke Methode für die Steuerung von Robotern etabliert, leidet jedoch unter hoher Inferenz…

arXiv – cs.LG 19.12.2025 05:00

SpecPV beschleunigt Langkontext-Generierung um bis zu 6x

Die steigende Nachfrage nach Aufgaben wie Code‑Generierung, tiefgreifendem Denken und dem Verständnis langer Dokumente hat die Langkontext‑…

arXiv – cs.LG 03.12.2025 05:00

Cacheback: Schnellere LLM-Inferenz durch spekulatives Decoding

Cacheback Decoding ist ein trainingsfreies, modellunabhängiges Verfahren, das die Lokalität von Sprache nutzt, um die Inferenz großer Sprac…

arXiv – cs.AI 01.12.2025 05:00

DAS beschleunigt RL-Training: Spekulatives Decoding nutzt Rollout-Verteilung

Reinforcement‑Learning‑Post‑Training ist heute unverzichtbar, um große Sprachmodelle (LLMs) zu verfeinern. Dabei wird die Effizienz zunehme…

arXiv – cs.LG 19.11.2025 05:00