LLMdoctor: Token‑basierte Optimierung für effiziente Test‑Zeit‑Anpassung von LLMs
Die Herausforderung, große Sprachmodelle (LLMs) an menschliche Präferenzen anzupassen, bleibt ein zentrales Thema in der KI-Forschung. Traditionelle Feinabstimmungsverfahren sind dabei oft rechenintensiv und wenig flexi…