Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Taxonomy”
Forschung

<p>DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 %</p> <p>In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar.</p> <p>Der D

arXiv – cs.AI
Forschung

<p>LLMs steigern IaC-Qualität durch strukturierte Wissensinjektion</p> <p>In einer aktuellen Studie wurde gezeigt, dass große Sprachmodelle (LLMs) bislang nur geringe Erfolgsraten bei der automatischen Erstellung von Infrastructure-as-Code (IaC) erzielen. Durch gezielte Einbindung von strukturiertem Konfigurationswissen konnten die Autoren die Leistung von LLMs für Terraform deutlich verbessern.</p> <p>Zur Evaluation wurde das bestehende IaC‑Eval‑Benchmark um Cloud‑Emulation und automatisierte Fehleranalyse

arXiv – cs.AI
Forschung

<p>Neue Studie liefert Leitfaden für nutzerzentrierte XAI-Entwicklung</p> <p>Mit der zunehmenden Verbreitung von KI im Alltag wächst der Wunsch nach Systemen, die nicht nur leistungsfähig, sondern auch verständlich sind. Explainable AI (XAI) soll dabei helfen, Entscheidungen und Vorhersagen nachvollziehbar zu machen. Bisher konzentrieren sich die Evaluationsmethoden jedoch zu stark auf technische Aspekte und berücksichtigen die Bedürfnisse der Endnutzer nicht ausreichend.</p> <p>In dieser Arbeit werden 65 N

arXiv – cs.AI