PeerRank: Selbstständige LLM‑Bewertung durch webbasierte Peer‑Reviews
Die neue Methode PeerRank ermöglicht es großen Sprachmodellen, sich selbst zu bewerten – ganz ohne menschliche Eingriffe oder vorgefertigte Referenzantworten. Durch die Kombination von automatisiert generierten Aufgaben, live Web‑Grounding und Peer‑Reviews entsteht ein vollständig autonomer Evaluationszyklus, der die Skalierbarkeit und Aktualität herkömmlicher Benchmarks deutlich übertrifft.