KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Evaluationsskripte”

Neue Methode schätzt Adversarial‑Risiko von LLMs bei Best‑of‑N Sampling

Wissenschaftler haben eine neue Technik entwickelt, die das wahre Risiko von großen Sprachmodellen (LLMs) unter realen Angriffsbedingungen…

arXiv – cs.AI 02.02.2026 05:00

Erste End-to-End-Pipeline für Handschriftenerkennung im alten Nepali

Forscher haben die erste komplette Pipeline für die Handschriftenerkennung (HTR) von alten nepalesischen Manuskripten vorgestellt – ein bed…

arXiv – cs.LG 22.12.2025 05:00

CarBench: Das erste Benchmark für 3D-Aerodynamik von Autos

Mit CarBench eröffnet ein neues Kapitel in der datengetriebenen Fahrzeugentwicklung. Das Projekt stellt das erste umfassende Benchmarking-F…

arXiv – cs.LG 10.12.2025 05:00

Multivariate Variational Autoencoder (MVAE) verbessert Rekonstruktion und Kalibrierung

Ein neues Modell, der Multivariate Variational Autoencoder (MVAE), wurde auf arXiv vorgestellt und verspricht, die Vorteile der klassischen…

arXiv – cs.LG 12.11.2025 05:00

WebRSSBench: MLLM‑Tests für Web‑Reasoning, Robustheit und Sicherheit

Ein neues Benchmark‑Set namens WebRSSBench wurde vorgestellt, um multimodale große Sprachmodelle (MLLMs) in ihrer Fähigkeit zu prüfen, komp…

arXiv – cs.AI 29.09.2025 05:00