Neues Benchmark für lernende Agenten: In-Context-Erfahrung in Produktempfehlungen
Ein neues Benchmarking-Set namens BELA (Benchmark for Experiential Learning and Active exploration) wurde auf arXiv veröffentlicht, um die Fähigkeit von KI-Agenten zu testen, aus Erfahrungen zu lernen und sich an wechse…