<p>Benchmark testet Sprachmodell-Sicherheit bei ängstlichen Eltern</p> <p>Immer mehr Eltern greifen auf große Sprachmodelle (LLMs) zurück, um schnelle Antworten zu medizinischen Fragen zu erhalten. Doch wie zuverlässig sind diese Systeme, wenn sie unter realen, oft ängstlichen und drängenden Bedingungen eingesetzt werden? Die neue Studie zeigt, dass die Sicherheit solcher Modelle in solchen Szenarien noch weitgehend unerforscht ist.</p> <p>Um diese Lücke zu schließen, wurde PediatricAnxietyBench entwickelt

arXiv – cs.AI Original
Anzeige