ReLope: KL-regularisierte LoRA-Probes verbessern Routing in multimodalen LLMs
Routing hat sich als vielversprechende Methode etabliert, um die Leistung großer Sprachmodelle (LLMs) mit Kosten zu balancieren. Dabei werden leichte Modelle mit leistungsstarken, aber teuren Großmodellen kombiniert. In…