MCP-Universe-Benchmark: GPT‑5 schlägt bei über der Hälfte realer Orchestrierungsaufgaben
Salesforce Research hat einen neuen Benchmark entwickelt, der die Leistungsfähigkeit von Sprachmodellen und agentenbasierten Systemen in echten Unternehmensaufgaben prüft. Der Test konzentriert sich auf komplexe Orchest…