Forschung
ConsRoute: Konsistenzbewusstes adaptive Routing für Cloud‑Edge‑LLMs
Large Language Models (LLMs) bieten beeindruckende Fähigkeiten, bringen jedoch erhebliche Latenzzeiten und Kosten mit sich, was ihre Nutzun…
arXiv – cs.AI