MCPGAUGE: Neuer Benchmark enthüllt Grenzen von Tool‑gestützten LLMs
Die Einführung des Model Context Protocol (MCP) hat die Vorstellung geweckt, dass große Sprachmodelle (LLMs) durch den Zugriff auf externe Ressourcen deutlich leistungsfähiger werden. Doch wie diese Fähigkeit tatsächlich genutzt wird, blieb bislang unklar. Mit dem neuen Evaluationsframework MCPGAUGE liefert die aktuelle Studie erstmals einen systematischen Einblick.