KI-gestützte intrinsische Motivation steigert RL bei sparsamen Belohnungen
Eine neue Studie auf arXiv zeigt, wie die Kombination zweier intrinsischer Motivationsstrategien die Effizienz von Reinforcement‑Learning‑Agenten in Umgebungen mit extrem spärlichen Belohnungen deutlich erhöht. In solchen Szenarien, in denen positives Feedback selten auftritt, scheitern klassische Lernalgorithmen häufig an mangelnder Exploration.