Qwen 3.7 Max erscheint und übertrifft Gemini 3.5 Flash im Intelligence Index

Alibaba hat Qwen 3.7 Max veröffentlicht, das im 10-Benchmark-Intelligence-Index vor Gemini 3.5 Flash landet und Discover AIs 12 Monate altes proprietäres Fahrstuhl-Puzzle-Benchmark beim ersten Versuch mit Selbstvalidierung gelöst hat.

Qwen 3.7 Max erscheint und übertrifft Gemini 3.5 Flash im Intelligence Index

Alibaba hat Qwen 3.7 Max veröffentlicht, das im Composite des Artificial-Analysis-Intelligence-Index unter den Top 10 landet und dabei Gemini 3.5 Flash übertrifft. In einem unabhängigen Test löste das Modell Discover AIs proprietäres, zwölf Monate altes Fahrstuhl-Puzzle-Benchmark — drei ineinandergreifende Optimierungsstränge — beim ersten Versuch, validierte das eigene Ergebnis und fand in einem zweiten Durchgang eine noch kürzere optimierte Lösung. Der generationsübergreifende Fortschritt zeigt sich unter anderem am Reasoning-Benchmark-Score, der von 8 (Qwen 3.6 Plus) auf 44 (Qwen 3.7 Max) gestiegen ist. Das Modell verschleiert Reasoning-Traces bewusst, um Chain-of-Thought-Destillation zu verhindern.

Warum das relevant ist

Diese Benchmark-Sprünge in Verbindung mit realen Testerfolgen positionieren Qwen 3.7 Max als ernsthaften Herausforderer im Frontier-Tier und fragmentieren das Wettbewerbsgefüge weiter, das bislang von OpenAI und Anthropic dominiert wurde. Alibabas offene Verfügbarkeitsstrategie bedeutet, dass die Leistungsgewinne der Entwickler-Community unmittelbar zugänglich sind.