Verlustfreie Kompression von Einbettungen mittels sphärischer Koordinaten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Eine neue Technik zur verlustfreien Kompression von Einbettungen mit Einheitsnorm wurde vorgestellt, die die Speichergröße um das 1,5‑fache reduziert – 25 % besser als die bisher beste Methode. Durch die Beobachtung, dass die sphärischen Koordinaten hochdimensionaler Einheitsvektoren sich um π/2 konzentrieren, lässt sich der IEEE‑754‑Exponent auf einen einzigen Wert zusammenfassen, was effizientes Entropie‑Codieren ermöglicht.

In 26 verschiedenen Konfigurationen, die Text-, Bild- und Mehrfachvektor‑Einbettungen abdecken, zeigte die Methode konsequente Verbesserungen. Sie erfordert kein Training und bleibt innerhalb der float32‑Genauigkeit vollständig verlustfrei.

Ähnliche Artikel