Forschung
Neues Verfahren verbessert LLM-Logik durch latentes Contrastive RL
Large Language Models (LLMs) glänzen bei der Erzeugung von Texten, doch bei komplexen Mehrschritt‑Aufgaben bleiben sie oft bei statistische…
arXiv – cs.LG