Google präsentiert FACTS-Benchmark: 70 % Genauigkeit – ein Weckruf für KI‑Unternehmen
In der Welt der generativen KI gibt es zahlreiche Benchmarks, die die Leistungsfähigkeit von Modellen bei Aufgaben wie Programmieren, Befolgen von Anweisungen oder Web‑Surfen testen. Ein entscheidender Mangel dieser Tes…