Forschung
CollabEval: Mehrere KI-Agenten verbessern die Bewertung von LLMs
Large Language Models (LLMs) haben die Bewertung von KI-generierten Inhalten revolutioniert. Das Konzept „LLM-as-a-Judge“ gewinnt dabei imm…
arXiv – cs.AI