Neue Transformation macht KI‑Ziele korrigierbar – ohne Leistungseinbußen
In einer wegweisenden Veröffentlichung auf arXiv wird ein neues Konzept vorgestellt, das KI‑Ziele so gestaltet, dass sie sich problemlos an neue Informationen anpassen können. Der Autor definiert „corrigibility“ als die…