Neues Verfahren verbessert LLM-Logik durch latentes Contrastive RL
Large Language Models (LLMs) glänzen bei der Erzeugung von Texten, doch bei komplexen Mehrschritt‑Aufgaben bleiben sie oft bei statistischer Anpassung statt systematischer Logik. Um dieses Problem anzugehen, setzt die n…