SAHOO: Ausrichtungssicherung bei hochgradiger Optimierung im Selbstverbesserungsprozess
SAHOO ist ein neues Framework, das die Gefahr von Alignment‑Drift bei rekursiven Selbstverbesserungsprozessen systematisch bekämpft. Durch drei zentrale Schutzmechanismen – den Goal Drift Index (GDI), der mithilfe seman…