Anthropic präsentiert Bloom: Open-Source-Framework für KI-Verhaltensanalysen
Anthropic hat das neue Open-Source-Framework Bloom vorgestellt, das automatisierte Verhaltensanalysen für hochmoderne KI-Modelle ermöglicht. Das Tool richtet sich an Forscher, die die Sicherheit und Ausrichtung von KI-Systemen prüfen wollen.
Bloom nimmt vom Nutzer definierte Verhaltensweisen auf und erstellt gezielte Tests, die messen, wie häufig und wie stark diese Verhaltensweisen in realistischen Szenarien auftreten. Durch die Automatisierung werden komplexe Evaluationsaufgaben deutlich schneller und konsistenter durchgeführt.
Die Entwicklung und Pflege von Verhaltensbewertungen ist bislang kostenintensiv und zeitaufwendig. Mit Bloom will Anthropic diesen Prozess vereinfachen und die Forschung an sicheren, ausgerichteten KI-Modellen beschleunigen.