DeepMind und OpenAI lösen Erdős-Probleme in derselben Woche
In derselben Woche knackten zwei unabhängige KI-Systeme Probleme aus Paul Erdős' berühmter Liste offener Fragen — einige davon seit mehr als einem halben Jahrhundert ungelöst. Google DeepMinds AlphaProof Nexus und ein allgemeinzweckiges OpenAI-LLM lieferten jeweils formale, verifizierbare Beweise, ohne eigens für die konkreten Probleme konzipiert worden zu sein. Vier separate Intelligence-Berichte erfassten diese Konvergenz, womit dies die bestkorroborierte Meldung des aktuellen Analysezyklus ist.
Was die Quellen tatsächlich berichten
Google DeepMind VP of Research Pushmeet Kohli kündigte AlphaProof Nexus am 25. Mai 2026 zusammen mit dem arXiv-Paper 2605.22763v1 an. Das System ist ein agentisches Framework für formale Beweissuche auf Basis von Gemini, das beim Einsatz gegen offene formale Mathematikprobleme neun offene Erdős-Probleme löste — darunter zwei, die seit 56 Jahren ungelöst waren — sowie 44 OEIS-Probleme, ein 15 Jahre altes offenes Problem in der algebraischen Geometrie und eine 7 Jahre alte offene Frage in der Min-Max-Optimierung. AlphaSignal berichtete, dass die Kosten pro gelöstem Problem bei wenigen Hundert Dollar lagen. Kohli fasst das Ergebnis explizit zusammen: „Diese Resultate zeigen das enorme Potenzial selbst einfacher agentischer Schleifen, die von Gemini angetrieben werden."
Wenige Tage später gab OpenAI-Forscher Noam Brown bekannt, dass ein OpenAI-LLM das Erdős-Planar-Unit-Distance-Problem gelöst hatte — offen seit 1946. Brown betonte den Mechanismus: „Das ist ein allgemeinzweckiges LLM. Es war weder auf dieses Problem noch auf Mathematik ausgerichtet. Und es ist kein Scaffold. Wir haben das Modell bei offenen Problemen nicht an seine Grenzen gebracht." Die Bedeutung liegt in der Allgemeinheit — keine Spezialisierung, kein maßgeschneidertes Scaffold, kein gezieltes Training für die Domäne. Ethan Mollick lieferte hilfreichen Maßstab: Jede Lösung kostete rund 0,6–6,3 kWh — das Stromäquivalent von etwa 32 Kilometern Elektrofahrt.
Strategische Einordnung
Zwei unkoordinierte Labore, dieselbe Woche, dieselbe Klasse ungelöster Probleme, beide mit allgemeinzweckigen Modellen: Diese Konvergenz ist das Signal. Formale Beweissuche ist keine KI-Nischendomäne mehr, die aufwändige Scaffolds erfordert. Teams, die KI für Wissenschaft, juristische Argumentation oder formale Verifikation einsetzen, sollten diese Woche als Wendepunkt in der Leistungsfähigkeit betrachten.
