Forschung
Agent0: Selbstentwickelnde Agenten ohne Daten – Tool-gestützte Logik
In der Welt der großen Sprachmodelle (LLMs) sind Agenten, die mit Reinforcement Learning (RL) trainiert werden, stark von menschlich kurati…
arXiv – cs.LG