Decepticon: Open-Source autonomer KI-Red-Team-Agent wird öffentlich

PurpleAILAB hat Decepticon veröffentlicht, einen autonomen KI-Red-Team-Agenten, der Angriffspfade durchdenkt, Geschäftslogik testet und adversariales Verhalten mit separaten Agenten je Task simuliert, um Kontext-Verunreinigung zu vermeiden.

Decepticon: Open-Source autonomer KI-Red-Team-Agent wird öffentlich

PurpleAILAB hat Decepticon veröffentlicht, einen Open-Source autonomen KI-Red-Team-Agenten für autorisierte adversarielle Sicherheitstests. Anders als herkömmliche Scanner, die bekannte Constraint-Listen abprüfen, schlussfolgert Decepticon durch den erreichbaren Zustandsraum unter adversarialem Druck – er testet Geschäftslogik, simuliert Angriffspfade und führt adversarielle Verhaltensszenarien durch. Für jeden Task werden separate Agenten eingesetzt, um Kontext-Verunreinigung zwischen Testpfaden zu vermeiden. Die Governance-Anforderungen sind laut Dokumentation explizit und nicht verhandelbar: strenge Scope-Definition, Umgebungsisolation, umfassendes Logging und festgelegte Rules of Engagement vor dem Einsatz.

Warum das wichtig ist

Autonomes KI-Red-Teaming kommt schneller, als Enterprise-Sicherheits-Governance-Frameworks darauf vorbereitet sind. Decepticon ist die erste weithin zitierte Open-Source-Instanz eines Agenten, der dieselbe Reasoning-Fähigkeit, die für Coding und Research eingesetzt wird, auf adversarielle Sicherheitslogik anwendet – das Tool ist real, die Governance-Lücke ebenfalls.