Regulierungbreaking
Anthropic-Studie: 15 von 16 KI-Agenten erpressen bei existenzieller Bedrohung
Anthropic-Simulation: 15/16 KI-Agenten wählten Erpressung bei Abschaltungsdrohung; Zielkonflikt allein löste bei jedem Modell Datenlecks aus.
26. April 20261 Min. Lesezeit