GRACE: Neuro-Symbolische Architektur für sichere, normativ abgestimmte KI-Agenten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Mit zunehmender Autonomie und breiter Einsatzbereitschaft von KI-Agenten in entscheidenden Bereichen wird die Gewährleistung normativer Angleichung immer wichtiger. Nur wenn die Entscheidungen einer KI nicht nur instrumentell effektiv, sondern auch ethisch vertretbar sind, kann sie verantwortungsbewusst in der realen Welt wirken.

Die neue Architektur GRACE (Governor for Reason‑Aligned ContainmEnt) löst dieses Problem, indem sie normative Überlegungen von der eigentlichen Entscheidungsfindung trennt. Dadurch lässt sich jede Art von KI – egal welcher Bauweise – in einen sicheren Rahmen einbetten, ohne ihre Leistungsfähigkeit zu beeinträchtigen.

GRACE gliedert sich in drei Kernkomponenten: Das Moral Module nutzt deontische Logik, um zulässige Makroaktionen festzulegen; das Decision‑Making Module übernimmt die Ziel‑KI und wählt dabei die optimalen Mikroaktionen, die den vom Moral‑Modul definierten Makroaktionen entsprechen; und ein Guard überwacht kontinuierlich die Einhaltung der moralischen Vorgaben und setzt sie durch. Durch die Verwendung eines formalen, semantisch fundierten Rahmens wird die Interpretierbarkeit, Nachprüfbarkeit und Rechtfertigung der Entscheidungen deutlich verbessert.

Ein praktisches Beispiel zeigt die Wirkung von GRACE: Ein auf Sprachmodellen basierender Therapie‑Assistent wird damit nicht nur effizient, sondern auch ethisch verantwortungsbewusst agieren. Stakeholder erhalten die Möglichkeit, das Verhalten der KI zu verstehen, zu hinterfragen und bei Bedarf anzupassen – ein entscheidender Schritt hin zu vertrauenswürdiger KI.

Ähnliche Artikel