Kontrollierbare Informationsproduktion: Neue Methode für intrinsische Motivation
Eine neue Forschungsarbeit präsentiert das Prinzip der kontrollierbaren Informationsproduktion (CIP) als innovativen Ansatz für intrinsische Motivation. Im Gegensatz zu bisherigen Methoden, die auf externen Belohnungen oder vom Designer festgelegten Variablen beruhen, arbeitet CIP ohne solche Vorgaben und ermöglicht autonome Lernprozesse.
Die Autoren leiten CIP aus dem Gebiet der optimalen Steuerung ab und zeigen damit eine direkte Verbindung zwischen extrinsischen und intrinsischen Verhaltensweisen auf. Durch diese Ableitung entsteht ein klares mathematisches Ziel, das die Agenten dazu anregt, eigenständig komplexe Aufgaben zu erkunden.
Im Kern definiert CIP die Differenz zwischen offenen und geschlossenen Kolmogorov–Sinai‑Entropien. Diese Lücke misst, wie viel Information ein Agent erzeugt, wenn er die Umgebung aktiv steuert, und belohnt gleichzeitig die gezielte Regulierung von chaotischen Dynamiken.
Die Arbeit liefert zudem wichtige theoretische Eigenschaften von CIP und demonstriert dessen Wirksamkeit an etablierten Benchmarks für intrinsische Motivation. Damit eröffnet CIP neue Perspektiven für die Entwicklung intelligenter, selbstlernender Systeme.