KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Dequantisierung”

Schnelle NF4‑Dequantisierung für große Sprachmodelle – 2,2× schnellere Kernel

Moderne Sprachmodelle überschreiten die Speichergrenzen einzelner GPU‑Geräte, sodass Quantisierung unumgänglich wird. Die 4‑Bit‑NormalFloat…

arXiv – cs.LG 06.04.2026 04:00

AXELRAM: Quantisierung ohne Dequantisierung – Attention-Score-Berechnung

AXELRAM bringt einen echten Durchbruch in der Berechnung von Attention‑Scores: Statt die KV‑Cache‑Indices zu dequantisieren, werden die Sco…

arXiv – cs.LG 06.04.2026 04:00

QuantVLA: Post-Training Quantisierung für Vision‑Language‑Action‑Modelle

QuantVLA ist ein neu entwickeltes, trainingsfreies Post‑Training‑Quantisierungsframework, das speziell für Vision‑Language‑Action‑Modelle (…

arXiv – cs.LG 25.02.2026 05:00

Quantisierungskonflikt: Weniger Bits kosten mehr Energie

Ein neuer Beitrag auf arXiv zeigt, dass die weit verbreitete Annahme, dass geringere Präzision immer zu mehr Effizienz führt, bei komplexen…

arXiv – cs.AI 17.02.2026 05:00

MOSS: Effizientes FP8-Training für große Sprachmodelle

FP8-Formate versprechen enorme Effizienzgewinne beim Training großer Sprachmodelle, bringen jedoch die Herausforderung einer reduzierten nu…

arXiv – cs.LG 11.11.2025 05:00