PERMA: Benchmark für personalisierte Agenten mit langfristigem Gedächtnis
Die Forschung zur Verbesserung von Sprachmodellen mit dauerhaftem Gedächtnis hat ein neues Benchmark namens PERMA vorgestellt, das die Fähigkeit von Agenten misst, sich über mehrere Interaktionen hinweg an Nutzerpräfere…