Reinforcement Learning stärkt LLM-Funktionsaufrufe: Adversarial Augmentation deckt Schwächen auf
Die Fähigkeit von großen Sprachmodellen (LLMs), externe Tools und APIs über Funktionsaufrufe zu nutzen, hat sich zu einem entscheidenden Erfolgsfaktor entwickelt. Traditionelle Ansätze zur Verbesserung dieser Funktional…