VALOR: Zero-Shot Agentic Prompt‑Moderation für sichere Bildgenerierung
Generative Vision‑Language‑Modelle wie Stable Diffusion können atemberaubende Bilder erzeugen, bergen jedoch das Risiko, unsichere, anstößige oder kulturell unangemessene Inhalte zu produzieren, wenn sie mit böswilligen Eingaben angesteuert werden. Traditionelle Schutzmechanismen stoßen an ihre Grenzen, weil sie entweder die Bildqualität mindern oder hohe Kosten verursachen.