Forschung
OKBench: Automatisierte, On‑Demand‑Benchmarks für dynamisches Wissen
Die Bewertung von großen Sprachmodellen (LLMs) im Bereich des wissensbasierten Frage‑Antwortens wird bislang vorwiegend mit statischen Benc…
arXiv – cs.AI