Forschung
Reinforcement Learning stärkt LLM-Funktionsaufrufe: Adversarial Augmentation deckt Schwächen auf
Die Fähigkeit von großen Sprachmodellen (LLMs), externe Tools und APIs über Funktionsaufrufe zu nutzen, hat sich zu einem entscheidenden Er…
arXiv – cs.AI