KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Bewertungsschema”

Neue Blaupause für kontinuierliche Verbesserung von Multi-Agenten-Einkaufsassistenten

Ein neues arXiv-Papier (2603.03565v1) präsentiert einen praxisnahen Leitfaden zur Bewertung und Optimierung von konversationellen Einkaufsa…

arXiv – cs.AI 05.03.2026 05:00

Neue Taxonomie enthüllt: Wie LLM-Agenten die Medizin revolutionieren

In einer wegweisenden Analyse wurden 49 Studien zu KI‑Agenten im Gesundheitswesen systematisch untersucht. Die Autoren entwickelten eine si…

arXiv – cs.AI 05.02.2026 05:00

<p>LLMs bewerten wissenschaftliche Abstracts: Studie zeigt moderate Übereinstimmung</p> <p>Eine aktuelle Untersuchung hat die Leistungsfähigkeit von großen Sprachmodellen (LLMs) bei der Bewertung von wissenschaftlichen Abstracts getestet. Dabei wurden 160 Abstracts einer lokalen Konferenz von menschlichen Gutachtern sowie von drei führenden LLMs – ChatGPT‑5, Gemini‑3‑Pro und Claude‑Sonnet‑4.5 – anhand desselben Bewertungsschemas beurteilt.</p> <p>Die Analyse der Interrater‑Reliabilität zeigte, dass die LLMs

arXiv – cs.AI 29.01.2026 05:00

KI-gestützte Codebewertung in CS1: Direkt- vs. Reverse-Ansatz im Vergleich

In Einsteigerkursen der Informatik ist die manuelle Bewertung von Programmieraufgaben oft mühsam und kann zu Inkonsistenzen führen. Während…

arXiv – cs.AI 20.11.2025 05:00

MovieCORE: KI-gestützte Fragen zu Filmen – tieferes Verständnis

Die neueste Veröffentlichung auf arXiv (2508.19026v1) stellt MovieCORE vor, ein Video‑Frage‑Antwort‑Datensatz, der speziell dafür entwickel…

arXiv – cs.AI 28.08.2025 05:00