Google AI präsentiert Stax – neues Tool zur Bewertung von LLMs
Die Bewertung großer Sprachmodelle (LLMs) gestaltet sich komplex, weil diese Systeme probabilistisch arbeiten. Das bedeutet, dass dieselbe Eingabe zu unterschiedlichen Ausgaben führen kann, was die Reproduzierbarkeit un…