Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “KI-Agenten”
Forschung

TraderBench: Wie robust sind KI-Agenten in feindlichen Kapitalmärkten?<br/><p>Die Bewertung von KI-Agenten im Finanzbereich steht vor zwei zentralen Problemen: Statische Benchmarks erfordern teure Expertenannotation und vernachlässigen gleichzeitig die dynamische Entscheidungsfindung, die im echten Handel entscheidend ist. Gleichzeitig führen LLM-basierte Richter zu unkontrollierter Varianz bei domänenspezifischen Aufgaben.</p><p>Mit TraderBench wird diese Lücke geschlossen. Das neue Benchmark-Framework kom

arXiv – cs.AI
Forschung

KI-Agenten: Wie gut spiegeln sie die reale Arbeitswelt wider?<br/><p>In einer neuen Studie von arXiv (2603.01203v1) wird untersucht, inwieweit die Entwicklung von KI-Agenten tatsächlich die Vielfalt und den Umfang menschlicher Arbeit abbildet. Die Forscher haben 43 Benchmarks und über 72.000 Aufgaben analysiert und diese mit den 1.016 realen US-Berufen verglichen. Dabei zeigte sich ein deutlicher Mismatch: Die meisten Benchmarks konzentrieren sich stark auf Programmieraufgaben, während die meisten Arbeitspl

arXiv – cs.AI
Forschung

KI-Agenten revolutionieren Sozialforschung: Können sie Wissenschaftler ersetzen?<p>In der neuesten Veröffentlichung auf arXiv wird beschrieben, wie KI-Agenten – Systeme, die mehrstufige Denkprozesse mit dauerhaftem Speicher, Tool-Zugriff und fachspezifischen Fähigkeiten ausführen – die Sozialforschung grundlegend verändern. Im Gegensatz zu herkömmlichen Chatbots, die nur auf einzelne Anfragen reagieren, können diese Agenten Dateien lesen, Code ausführen, Datenbanken abfragen, das Web durchsuchen und domänen

arXiv – cs.AI