Neue Studie prüft komplexe Logik von Sprachmodellen über Black-Box-Interaktion
Eine neue Untersuchung aus dem arXiv-Repository präsentiert ein innovatives Verfahren, um die Denkfähigkeit großer Sprachmodelle (LLMs) in interaktiven, unbekannten Umgebungen zu testen. Traditionelle Aufgaben bewerten…