ValuePilot: Zwei-Phasen-Framework für wertorientierte Entscheidungen
In der rasanten Entwicklung von KI-Systemen wird die Anpassung an individuelle Werte immer wichtiger. ValuePilot bietet dafür einen klaren, zweistufigen Ansatz, der personalisierte Entscheidungen auf Basis von stabilen, übertragbaren Wertsignalen ermöglicht.
Die erste Phase, das Dataset Generation Toolkit (DGT), erzeugt mithilfe einer kollaborativen Pipeline zwischen Menschen und großen Sprachmodellen (LLM) vielfältige, wertannotierte Szenarien. Diese Daten bilden die Grundlage für die zweite Phase, das Decision-Making Module (DMM), das lernt, Handlungen anhand persönlicher Wertpräferenzen zu bewerten.
In Tests mit bislang unbekannten Szenarien übertrifft das DMM starke LLM-Baselines wie GPT‑5, Claude‑Sonnet‑4, Gemini‑2‑flash und Llama‑3.1‑70b in der Übereinstimmung mit menschlichen Entscheidungen. Diese Ergebnisse zeigen, dass wertorientierte Entscheidungsfindung nicht nur interpretierbarer, sondern auch anpassungsfähiger ist als rein auf Aufgaben ausgerichtete Modelle.
ValuePilot demonstriert damit einen praktikablen, erweiterbaren Weg zur Schaffung von KI-Agenten, die sowohl nachvollziehbar als auch individuell auf die Werte ihrer Nutzer abgestimmt sind.