Dora: QoE‑bewusster Hybrid‑Parallelismus für verteiltes Edge‑AI
Mit der rasanten Verbreitung von Edge‑AI-Anwendungen wird die Qualität der Nutzererfahrung – insbesondere die Latenz bei Modellinferenz – zu einem zentralen Ziel. Da die Modelle jedoch oft die Ressourcen einzelner Gerät…