LLMs neu bewertet: Anthropomorphes, wertorientiertes Evaluationsmodell
In der Welt der großen Sprachmodelle (LLMs) besteht weiterhin eine Kluft zwischen Benchmark‑Leistungen und echter Anwendbarkeit. Aktuelle Bewertungsansätze konzentrieren sich zu stark auf technische Kennzahlen und verna…