Neues Benchmark RealPref prüft, wie LLMs langfristig Nutzerpräferenzen folgen
Large Language Models (LLMs) werden immer häufiger als persönliche Assistenten eingesetzt, wobei Nutzer ihre komplexen und vielfältigen Präferenzen über längere Interaktionen hinweg teilen. Doch bislang fehlt ein system…