TurtleSoup-Bench: LLMs im kreativen Denken getestet
In einer neuen Studie wird die Fähigkeit großer Sprachmodelle (LLMs) zum „imaginativen Denken“ untersucht – das heißt, wie sie in knappen Informationsumgebungen eigenständig Hypothesen aufbauen, prüfen und anpassen. Traditionelle Tests konzentrieren sich meist auf statische Aufgaben oder soziale Deduktion und greifen daher die dynamische, explorative Natur dieses Denkprozesses nicht ab.