Von Erklärbarkeit von Features zu Aktionen: statisch vs agentisch
Eine neue Arbeit, veröffentlicht auf arXiv (2602.06841v1), beleuchtet die Erklärbarkeit von KI-Systemen, die über mehrere Schritte hinweg handeln. Während die Forschung in den letzten zehn Jahren vor allem einzelne Vorhersagen interpretierte, ermöglichen moderne große Sprachmodelle (LLMs) agentische KI, deren Erfolg von einer gesamten Entscheidungssequenz abhängt.