Tape: Benchmark für Reinforcement Learning – Regelwechsel testen
Forscher haben Tape entwickelt, ein neues Benchmark-Tool, das Reinforcement‑Learning‑Algorithmen gezielt auf ihre Fähigkeit prüft, sich an veränderte Regeln anzupassen. Durch die Nutzung eindimensionaler Zellulärer Automaten bleibt der Beobachtungs‑ und Aktionsraum konstant, während die Übergangsregeln variieren. So lässt sich das Verhalten von Modellen unter Out‑of‑Distribution‑Bedingungen (OOD) exakt beobachten.