ItinBench: LLMs im Test – Planung über mehrere kognitive Dimensionen
In der Forschung zu großen Sprachmodellen (LLMs) rückt die Fähigkeit, komplexe Planungsaufgaben zu lösen, immer stärker in den Fokus. Traditionelle Tests konzentrieren sich häufig auf einzelne, kontrollierte Fragen zu L…