LLMs lernen besser zu denken: MARO nutzt soziale Interaktion
In der heutigen Welt stehen Menschen täglich vor Situationen, die tiefes Urteilsvermögen und logisches Denken erfordern. Traditionelle Trainingsmethoden für große Sprachmodelle (LLMs) beschränken sich jedoch meist auf das Lesen von Texten oder das Lösen vorgegebener Aufgaben. Dadurch fehlt den Modellen die Möglichkeit, in realen Szenarien zu interagieren, zu verhandeln und mit anderen zu konkurrieren.