Beacon: Quantisierung ohne manuelle Abstimmung – Effiziente PTQ für große Modelle
Die neue Methode Beacon revolutioniert die Post‑Training‑Quantisierung (PTQ) großer vortrainierter Modelle. Sie ersetzt die bisher üblichen manuellen Skalierungstuning‑Schritte durch einen automatischen, geometrie‑basierten Ansatz, der die optimalen Skalierungsfaktoren direkt aus dem quantisierten Gitter bestimmt.