Neue Methode steigert Effizienz von LLMs: Reward-Filtered Sequential Inference
Test‑Time‑Compute (TTC) hat sich als zentrales Konzept zur Optimierung großer Sprachmodelle etabliert. Trotz der Erfolge von Techniken wie Best‑of‑n‑Sampling und sequentieller Revision bleibt die theoretische Grenze die…