DecisionLLM: LLMs revolutionieren langfristige Entscheidungsfindung
In der Welt der langfristigen Entscheidungsfindung, die bislang vor allem durch Reinforcement Learning (RL) adressiert wurde, eröffnet ein neues Konzept spannende Perspektiven. Das Decision Transformer hat gezeigt, dass RL als autoregressives Sequenzmodell verstanden werden kann. Gleichzeitig haben große Sprachmodelle (LLMs) ihre Fähigkeiten in komplexen Denk- und Planungsaufgaben unter Beweis gestellt. Die Frage, ob LLMs – die auf derselben Transformer‑Architektur basieren, jedoch in einem viel größeren Maßstab arbeiten – die Leistung bei langfristigen, sequentiellen Entscheidungsproblemen steigern können, steht im Fokus dieser Studie.