KI News: Kurz und klar.

Anmelden

IMPQ: Interaction-Aware Layerwise Mixed Precision Quantization for LLMs

arXiv – cs.LG • 22.09.2025 05:00 • Original

#LLM #mixed-precision quantization #Shapley #Interaction-aware #PTQ #LLaMA-3 #Gemma-2 #Qwen-3

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 06.02.2026 05:00

TurboBoA: Schnellere, genaue Attention-Quantisierung ohne Backpropagation

arXiv – cs.LG • 13.01.2026 05:00

Kommunikation im latenten Raum durch K‑V‑Cache‑Ausrichtung

arXiv – cs.LG • 03.09.2025 05:00

ZeroQAT: Quantisierung ohne Backpropagation – effizient und präzise

arXiv – cs.LG • 11.02.2026 05:00

Hybrid-Parallelität für große Sprachmodelle: Systematischer Leitfaden und Vergleich

arXiv – cs.LG • 11.02.2026 05:00

LLM-gestützte Regeln verbessern partizipatives Budgetieren

arXiv – cs.AI • 11.02.2026 05:00

Neuer Ansatz: Autoregressive DPO optimiert Sprachmodelle nach menschlichen Präferenzen