Qwen 3.7 Max erscheint und übertrifft Gemini 3.5 Flash im Intelligence Index
Alibaba hat Qwen 3.7 Max veröffentlicht, das im Composite des Artificial-Analysis-Intelligence-Index unter den Top 10 landet und dabei Gemini 3.5 Flash übertrifft. In einem unabhängigen Test löste das Modell Discover AIs proprietäres, zwölf Monate altes Fahrstuhl-Puzzle-Benchmark — drei ineinandergreifende Optimierungsstränge — beim ersten Versuch, validierte das eigene Ergebnis und fand in einem zweiten Durchgang eine noch kürzere optimierte Lösung. Der generationsübergreifende Fortschritt zeigt sich unter anderem am Reasoning-Benchmark-Score, der von 8 (Qwen 3.6 Plus) auf 44 (Qwen 3.7 Max) gestiegen ist. Das Modell verschleiert Reasoning-Traces bewusst, um Chain-of-Thought-Destillation zu verhindern.
Warum das relevant ist
Diese Benchmark-Sprünge in Verbindung mit realen Testerfolgen positionieren Qwen 3.7 Max als ernsthaften Herausforderer im Frontier-Tier und fragmentieren das Wettbewerbsgefüge weiter, das bislang von OpenAI und Anthropic dominiert wurde. Alibabas offene Verfügbarkeitsstrategie bedeutet, dass die Leistungsgewinne der Entwickler-Community unmittelbar zugänglich sind.