KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “speculative sampling”

Reinforcement Learning beschleunigt spekulatives Sampling bei LLMs

Die Latenz bei der Inferenz großer Sprachmodelle bleibt ein zentrales Problem für den Einsatz in der Praxis. Aktuelle spekulative Sampling‑…

arXiv – cs.LG 21.01.2026 05:00

RADAR beschleunigt LLM‑Inferenz dank RL‑basierter dynamischer Entwurfsbäume

Die Ausführung moderner Large Language Models (LLMs) ist bislang teuer und langsam. Eine vielversprechende Lösung ist das sogenannte specul…

arXiv – cs.AI 17.12.2025 05:00

Optimales Multi‑Draft‑Sampling: Convex‑Optimierung für LLMs

In einer neuen Studie wird gezeigt, wie die Latenz beim Autoregressive‑Decoding von großen Sprachmodellen (LLMs) drastisch gesenkt werden k…

arXiv – cs.LG 21.11.2025 05:00