Suche Anmelden

Forschung arXiv – cs.AI

Open Deep Research Agent erreicht mit ODR+ 10 % Erfolg bei neuem Benchmark

15.08.2025 05:00 • ≈1 Min. Lesezeit • Originalquelle

#Deep Research Agents #Open Deep Research #BrowseComp #Anthropic #Google #Ablationsstudien

Kernaussagen

Das nimmst du aus dem Beitrag mit

Deep Research Agents (DRAs) sind KI‑Systeme, die aus einer natürlichen Sprachaufforderung des Nutzers eigenständig im Internet nach relevanten Informationen suchen und d…
Obwohl aktuelle DRAs beeindruckende Leistungen auf öffentlichen Benchmarks zeigen, sind die meisten dieser Systeme proprietär und nicht offen zugänglich.
In der vorliegenden Studie wurde das neue, offene DRA‑System Open Deep Research (ODR) mit dem anspruchsvollen BrowseComp‑Benchmark verglichen.

Deep Research Agents (DRAs) sind KI‑Systeme, die aus einer natürlichen Sprachaufforderung des Nutzers eigenständig im Internet nach relevanten Informationen suchen und diese nutzen, um die Aufgabe zu lösen. Obwohl aktuelle DRAs beeindruckende Leistungen auf öffentlichen Benchmarks zeigen, sind die meisten dieser Systeme proprietär und nicht offen zugänglich.

In der vorliegenden Studie wurde das neue, offene DRA‑System Open Deep Research (ODR) mit dem anspruchsvollen BrowseComp‑Benchmark verglichen. Um die Rechenanforderungen für akademische Labore zu reduzieren, wurde ein kleinerer Teil des Benchmarks – BrowseComp‑Small (BC‑Small) – entwickelt. Auf diesem Testset mit 60 Fragen erzielten ODR, ein System von Anthropic und ein System von Google jeweils 0 % Genauigkeit.

Durch die Einführung dreier gezielter Verbesserungen wurde ODR zu ODR+ weiterentwickelt. Das neue Modell erreichte damit einen Rekordwert von 10 % Erfolgsrate auf BC‑Small und übertraf damit sowohl die offenen als auch die geschlossenen Systeme. Ablationsstudien zeigten, dass jede der drei Verbesserungen einen wesentlichen Beitrag zum Erfolg von ODR+ leistete.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Was veraendert sich praktisch?

Ist das eher Signal, Produkt oder nur kurzfristiger Hype?

Begriffe zum Einordnen

Kontext ohne Glossar-Suche

Deep Research Agents

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Open Deep Research

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

BrowseComp

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

arXiv – cs.AI

Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.

Lernpfad

Wenn du nach dieser Meldung weiterlernen willst

Themen-Hub

Deep Research Agents systematisch verfolgen

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Archiv

Weitere Beispiele zu Deep Research Agents

Nutze das Archiv, um Muster, Wiederholungen und Trendlinien innerhalb des Themas zu sehen.

Im Themen-Cluster weiter

Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen

Themen-Hub

Deep Research Agents

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

0 Signale in 7 Tagen • 2 Artikel im Hub

Hub oeffnen →

Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen

VentureBeat – AI

Claude Opus 4.5 von Anthropic: günstiger, unbegrenzte Chats, bessere Programmierfähigkeiten

24.11.2025 21:35

VentureBeat – AI

Anthropic startet neue Claude‑AI‑Funktionen für Schüler und Entwickler

14.08.2025 18:00

VentureBeat – AI

Google erweitert Gemini: Begrenzte Personalisierung & neue temporäre Chats

13.08.2025 21:45

Wired – AI (Latest)

KI-Industrie-Gegner schließen sich für Startup-Accelerator zusammen

11.02.2026 10:55

MIT Technology Review – Artificial Intelligence

Das missverstandene Diagramm, das die KI-Welt erschüttert

05.02.2026 10:00

AI News (TechForge)

KI-Diagnostik: OpenAI, Google und Anthropic starten neue medizinische Tools

15.01.2026 07:00

Warum das wichtig ist

Relevant fuer Leserinnen und Leser, die KI nicht nur verfolgen, sondern einordnen wollen: Der Beitrag zeigt, was sich bei Deep Research Agents, Open Deep Research konkret verschiebt und welche Folgen das fuer Nutzung, Produkte oder Entscheidungen haben kann. Ausgangspunkt ist die Quelle arXiv – cs.AI.

Quellenklarheit

Quelle: arXiv – cs.AI
Original: Zum Ursprungsbeitrag
Website: arXiv – cs.AI

Themenradar

Themen folgen

Deep Research Agents

Open Deep Research

BrowseComp

Anthropic

Morning Briefing

Diese Themen im Briefing verfolgen

Wenn dich genau diese Themen wieder interessieren werden, mach daraus einen festen Morgen-Slot statt einzelner Zufallsklicks.

Briefing mit Fokus konfigurieren →

Welche Linse du auf diese Meldung legen solltest

Kontext ohne Glossar-Suche

Wenn du nach dieser Meldung weiterlernen willst

Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen

Aehnliche Entwicklungen zum Weiterlesen

🍪 Cookie-Einstellungen