LLM‑gestützte Prompted Policy Search revolutioniert Reinforcement Learning
Reinforcement Learning (RL) hat sich lange Zeit auf reine Zahlenwerte als Belohnung beschränkt, wodurch die reichhaltige semantische Information, die in vielen realen Aufgaben vorhanden ist, ungenutzt bleibt. Menschen h…