Verlustfreie Kompression von Einbettungen mittels sphärischer Koordinaten
Eine neue Technik zur verlustfreien Kompression von Einbettungen mit Einheitsnorm wurde vorgestellt, die die Speichergröße um das 1,5‑fache reduziert – 25 % besser als die bisher beste Methode. Durch die Beobachtung, dass die sphärischen Koordinaten hochdimensionaler Einheitsvektoren sich um π/2 konzentrieren, lässt sich der IEEE‑754‑Exponent auf einen einzigen Wert zusammenfassen, was effizientes Entropie‑Codieren ermöglicht.
In 26 verschiedenen Konfigurationen, die Text-, Bild- und Mehrfachvektor‑Einbettungen abdecken, zeigte die Methode konsequente Verbesserungen. Sie erfordert kein Training und bleibt innerhalb der float32‑Genauigkeit vollständig verlustfrei.