Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Benchmark-Framework”
Forschung

TraderBench: Wie robust sind KI-Agenten in feindlichen Kapitalmärkten?<br/><p>Die Bewertung von KI-Agenten im Finanzbereich steht vor zwei zentralen Problemen: Statische Benchmarks erfordern teure Expertenannotation und vernachlässigen gleichzeitig die dynamische Entscheidungsfindung, die im echten Handel entscheidend ist. Gleichzeitig führen LLM-basierte Richter zu unkontrollierter Varianz bei domänenspezifischen Aufgaben.</p><p>Mit TraderBench wird diese Lücke geschlossen. Das neue Benchmark-Framework kom

arXiv – cs.AI
Forschung

<p>Bench4HLS: Revolutionäres Benchmark-Framework für LLM-gestützte HLS-Entwicklung</p> <p>In den vergangenen zwei Jahren haben große Sprachmodelle (LLMs) beeindruckende Fortschritte bei der Codegenerierung erzielt – von einfachen Skripten bis hin zu komplexen Hardwaredesigns auf Register-Transfer-Ebene (RTL). Im Bereich der High-Level Synthesis (HLS) ist die Nutzung von LLMs zwar noch nicht so weit verbreitet, doch die Zahl der HLS‑bezogenen Studien hat sich in den letzten sechs Monaten von einem Verhältnis

arXiv – cs.AI