SkillOpt: Microsoft zeigt, dass Agenten-Skills per Text-Gradienten automatisch optimiert werden können

Microsoft und die Shanghai Jiao Tong University haben SkillOpt veröffentlicht, das SKILL.md-Dateien per Text-Gradienten optimiert — GPT-5.5-Such-Q&A-Genauigkeit steigt von 77,7 % auf 87,3 %, übertrifft menschlich erstellte und GaiPa-Baselines. Als SkillLens quelloffen veröffentlicht.

SkillOpt: Microsoft zeigt, dass Agenten-Skills per Text-Gradienten automatisch optimiert werden können

Microsoft Research und die Shanghai Jiao Tong University haben SkillOpt vorgestellt — ein Framework, das Agenten-SKILL.md-Dateien als lernbare Parameter behandelt. Ein Optimierungs-LLM analysiert Trainings-Trajektorien eines eingefrorenen Zielmodells, schlägt begrenzte Bearbeitungen der Skill-Datei als „textuelle Gradienten" vor und validiert die Änderungen durch Sandbox-Ausführung. Auf GPT-5.5 bei Such-Q&A angewendet, stieg der Score von 77,7 % (ohne Skill) auf 87,3 % — damit werden sowohl menschlich erstellte als auch GaiPa-Baselines übertroffen. Die finalen optimierten Skills sind kompakt: 1–3 atomare Bearbeitungen, rund 880 Token. Das Framework wurde als SkillLens auf GitHub als Open Source veröffentlicht.

Warum das relevant ist

Die automatisierte Optimierung prozeduraler Wissensdokumente eröffnet einen Weg zur Selbstverbesserung von Agenten-Anweisungen — ohne Modell-Retraining. SkillOpt-optimierte Skills sind zwischen Claude Code, Codex und Cursor portierbar und etablieren damit eine plattformübergreifende, übertragbare prozedurale Intelligenzschicht.