Skalierung der in-Context Online-Lernfähigkeit von LLMs mittels Meta‑RL
Large Language Models (LLMs) erzielen erstklassige Ergebnisse, wenn sämtliche Aufgabenrelevanten Informationen sofort vorliegen – etwa bei statischen Vorhersagen oder Anweisungsbefolgung. In vielen realen Entscheidungsa…