Forschung
Trajektorienreduktion steigert Leistung von Diffusions-LLMs
Die neu entwickelte Methode dTRPO (Trajectory Reduction Policy Optimization) setzt neue Maßstäbe für die Optimierung von Diffusions‑Large‑L…
arXiv – cs.AI