Forschung
Bi-Level Prompt-Optimierung stärkt multimodale LLM-Judges bei Bildbewertungen
Große Sprachmodelle (LLMs) werden zunehmend als automatisierte Richter eingesetzt, um KI-generierte Inhalte zu bewerten. Trotz ihrer beeind…
arXiv – cs.AI