SkillOpt: Microsoft zeigt, dass Agenten-Skills per Text-Gradienten automatisch optimiert werden können
Microsoft Research und die Shanghai Jiao Tong University haben SkillOpt vorgestellt — ein Framework, das Agenten-SKILL.md-Dateien als lernbare Parameter behandelt. Ein Optimierungs-LLM analysiert Trainings-Trajektorien eines eingefrorenen Zielmodells, schlägt begrenzte Bearbeitungen der Skill-Datei als „textuelle Gradienten" vor und validiert die Änderungen durch Sandbox-Ausführung. Auf GPT-5.5 bei Such-Q&A angewendet, stieg der Score von 77,7 % (ohne Skill) auf 87,3 % — damit werden sowohl menschlich erstellte als auch GaiPa-Baselines übertroffen. Die finalen optimierten Skills sind kompakt: 1–3 atomare Bearbeitungen, rund 880 Token. Das Framework wurde als SkillLens auf GitHub als Open Source veröffentlicht.
Warum das relevant ist
Die automatisierte Optimierung prozeduraler Wissensdokumente eröffnet einen Weg zur Selbstverbesserung von Agenten-Anweisungen — ohne Modell-Retraining. SkillOpt-optimierte Skills sind zwischen Claude Code, Codex und Cursor portierbar und etablieren damit eine plattformübergreifende, übertragbare prozedurale Intelligenzschicht.