Trajektorienreduktion steigert Leistung von Diffusions-LLMs
Die neu entwickelte Methode dTRPO (Trajectory Reduction Policy Optimization) setzt neue Maßstäbe für die Optimierung von Diffusions‑Large‑Language‑Models (dLLMs). Durch die gezielte Reduktion der Kosten für Trajektorien…