Google präsentiert RL-Framework, das Modelle zum komplexen Denken befähigt
Forscher der Google Cloud und der UCLA haben ein neues Reinforcement‑Learning‑Framework vorgestellt, das es kleinen Sprachmodellen ermöglicht, anspruchsvolle Mehr‑Schritt‑Logikaufgaben zu meistern. Das System, genannt S…