W&D: Parallele Toolnutzung steigert Effizienz von Deep Research Agents
Deep‑Research‑Agenten haben sich als leistungsstarke Werkzeuge etabliert, die komplexe intellektuelle Aufgaben durch mehrstufiges Denken und das gezielte Abrufen von Web‑Informationen automatisieren. Während jüngste Studien die Tiefe dieser Agenten durch mehr Aufrufe von Denk‑ und Tool‑Schritten erhöht haben, blieb die Möglichkeit, die Breite durch parallele Tool‑Aufrufe zu vergrößern, weitgehend unerforscht.
In diesem Beitrag stellt das Team das „Wide and Deep“ Forschungsframework vor, das gezielt untersucht, wie Agenten sowohl in der Tiefe als auch in der Breite durch parallele Tool‑Aufrufe performen. Im Gegensatz zu bisherigen Ansätzen, die auf komplexe Multi‑Agent‑Orchestrierung setzen, nutzt die neue Methode die inhärente Parallelität von Tool‑Aufrufen innerhalb eines einzigen Denk‑Schritts, um die Koordination zu optimieren.
Die Experimente zeigen, dass eine breitere Parallelisierung die Leistung auf anspruchsvollen Deep‑Research‑Benchmarks deutlich steigert und gleichzeitig die Anzahl der benötigten Runden reduziert. Besonders beeindruckend ist die 62,2 %ige Genauigkeit des GPT‑5‑Medium Modells auf dem BrowseComp‑Test, die die zuvor berichteten 54,9 % des GPT‑5‑High Modells übertrifft – und das ohne zusätzliche Kontext‑Management‑Tricks.
Durch Fallstudien und die Analyse verschiedener Scheduler‑Strategien für Tool‑Aufrufe wird deutlich, dass die optimale Balance zwischen Breite und Tiefe ein entscheidender Faktor für hoch effiziente Deep‑Research‑Agenten ist. Diese Erkenntnisse legen einen klaren Weg für die Weiterentwicklung leistungsfähiger, paralleler Agenten auf.