Health-ORSC-Bench: Benchmark für Überablehnung und sichere Antworten in der Medizin
Die Sicherheit von Sprachmodellen im Gesundheitsbereich ist von entscheidender Bedeutung. Traditionelle, binäre Ablehnungsgrenzen führen häufig zu einer übermäßigen Ablehnung harmloser Anfragen oder zu einer gefährlichen Compliance bei schädlichen Fragen. Diese Extremfälle werden zwar bereits gemessen, doch die Fähigkeit, bei zweideutigen oder Grenzfragen hilfreiche, aber sichere Antworten zu geben, bleibt bislang unberücksichtigt.