VAL-Bench: Measuring Value Alignment in Language Models
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
Roblox Guard 1.0: Neues LLM-Modell mit robusten Moderations-Guardrails
arXiv – cs.AI
•
MultiGA: LLMs kombinieren – Evolutionäre Algorithmen für NLP
arXiv – cs.AI
•
DUALGAUGE: Automatisiertes Benchmarking für sichere und korrekte Codegenerierung
arXiv – cs.LG
•
Datenbasierte Studie zeigt, wie LLM‑Struktur Leistung bestimmt
Analytics Vidhya
•
Another BIG AI from China! LongCat-Flash Chat 560B
arXiv – cs.AI
•
TowerMind: Neues Tower-Defense-Umfeld für LLM-Agenten