Meta Hyperagents (DGM-H) verallgemeinert Selbstverbesserung über Coding-Aufgaben hinaus
Metas Hyperagents (DGM-H) verschmelzen den Aufgaben-Agenten und den Meta-Agenten zu einem einzigen editierbaren Programm – sodass nicht nur der aufgabenlösende Code, sondern der Verbesserungsmechanismus selbst evolvieren kann. Beim Training entwickelten Hyperagents eigenständig persistente Speichermodule, Leistungsnachverfolgungssysteme und mehrstufige Evaluierungspipelines, ohne explizite menschliche Anweisung. Die Gutachterleistung bei Paper-Reviews stieg von 0,0 auf 0,710 Genauigkeit; der Reward bei der Vierfüßer-Fortbewegung verbesserte sich von 0,060 auf 0,372 – übertrifft damit die menschlich entworfene Baseline von 0,348. Das System erweitert Sakana AIs Darwin-Gödel-Maschine, die SWE-bench von 20 % auf 50 % verbesserte, jedoch auf Coding-Aufgaben beschränkt blieb.
Einordnung
Dass Hyperagents Generalisierung über Domänen hinweg erzielen – Paper-Review, Robotersteuerung und Coding – deutet darauf hin, dass selbstverbessernde Agenten kein coding-spezifisches Phänomen mehr sind. Das eigenständige Evolvieren von Speicher- und Evaluierungsinfrastruktur ist der bisher deutlichste Beleg dafür, dass Agenten ihren eigenen Harness ohne menschliches Scaffolding entwerfen können.