UniQL: Quantisierung & Low‑Rank‑Kompression für Edge‑LLMs
Das Betreiben großer Sprachmodelle auf mobilen Geräten ist wegen begrenzter Speicher‑ und Rechenressourcen besonders schwierig. Die verfügbare Kapazität hängt zudem von der aktuellen Auslastung des Geräts ab, was die Zu…