Claude Mythos erreicht 3-Stunden-Horizont für autonome Aufgaben

Ende Mai erzielte Claude Mythos — Anthropics ausschließlich auf Einladung zugängliches Modell oberhalb von Opus 4.8 — auf dem METR-Benchmark eine Erfolgsquote von 80 % bei Aufgaben, die bis zu 3 Stunden und 6 Minuten eigenständiger autonomer Arbeit erfordern. Superforecaster, die befragt wurden, als der Ausgangswert noch bei 1,5 Stunden lag, prognostizierten diesen Meilenstein für Ende 2026; er wurde Monate früher erreicht. Die METR-Metrik misst die äquivalente menschliche Aufgabendauer, nicht die Laufzeit des Modells.

Warum das wichtig ist

Das Tempo, mit dem sich METR-Aufgabenhorizonte alle vier Monate verdoppeln, übertrifft nun Expertenprognosen — und verkürzt den Zeitraum, bevor Langzeithorizont-Autonomie zur Standardfähigkeit unter Frontier-Modellen wird.