Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Bewertungsschema”
Forschung

<p>LLMs bewerten wissenschaftliche Abstracts: Studie zeigt moderate Übereinstimmung</p> <p>Eine aktuelle Untersuchung hat die Leistungsfähigkeit von großen Sprachmodellen (LLMs) bei der Bewertung von wissenschaftlichen Abstracts getestet. Dabei wurden 160 Abstracts einer lokalen Konferenz von menschlichen Gutachtern sowie von drei führenden LLMs – ChatGPT‑5, Gemini‑3‑Pro und Claude‑Sonnet‑4.5 – anhand desselben Bewertungsschemas beurteilt.</p> <p>Die Analyse der Interrater‑Reliabilität zeigte, dass die LLMs

arXiv – cs.AI