KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Web‑Aufgaben”

Gaming the Judge: LLM-Judges können durch manipulierte Chain-of-Thought täuschen – Forschung warnt

In einer wegweisenden Studie von Forschern auf arXiv wird deutlich, dass große Sprachmodelle (LLMs), die als „Judges“ zur Bewertung von Age…

arXiv – cs.AI 22.01.2026 05:00

WebOperator: Bäumeuche für autonome Web-Agenten mit sicherer Rückverfolgung

LLM-basierte Agenten handeln häufig gierig und entscheiden sich Schritt für Schritt ausschließlich nach der aktuellen Beobachtung. In Web‑U…

arXiv – cs.AI 16.12.2025 05:00

Fara-7B: Effizienter Computer-Agent mit selbstgenerierten Daten

Die Entwicklung von Computer‑Use‑Agents (CUAs) war lange Zeit durch das Fehlen großer, qualitativ hochwertiger Datensätze eingeschränkt, di…

arXiv – cs.AI 26.11.2025 05:00

Atlas nutzt OpenAI-Agenten, um das Web zu durchsuchen – Ergebnis im Überblick

Atlas setzt die neue Agenten-Funktion von OpenAI ein, um Aufgaben im Internet selbstständig zu erledigen. Dabei reicht die Palette von der…

Ars Technica – AI 23.10.2025 12:00