CUBE: Neuer Standard zur Vereinheitlichung von Agenten-Benchmarks
Die rasante Verbreitung von Agenten-Benchmarks hat ein starkes Fragmentierungsproblem geschaffen, das die Forschungseffizienz gefährdet. Für jedes neue Benchmark-System ist eine umfangreiche, individuelle Integration er…