Microsoft und Uber konfrontieren die wahren KI-Kosten: Subventionsära endet

Die Niedrigpreisphase der Enterprise-KI geht in konkreten Kaufentscheidungen zu Ende. Microsoft kündigte interne Claude-Code-Lizenzen auf, weil die tokenbasierte Abrechnung selbst bei praktisch unbegrenzten Cloud-Ressourcen nicht tragfähig war; der CTO von Uber warnte intern, das Unternehmen habe sein gesamtes KI-Budget für 2026 in vier Monaten aufgebraucht. Drei unabhängige Quellen-Batches bestätigten diese Entwicklung — kein vereinzelter Wechsel, sondern eine strukturelle Neupreisgestaltung, die jedes KI-intensive Unternehmen gleichzeitig trifft.

Was die Quellen tatsächlich berichten

Marktanalyst @HedgieMarkets — dessen Beitrag von Yann LeCun weiterverbreitet wurde — beschreibt die Dynamik präzise: „Die KI-Subventionsära endet in Echtzeit." Microsoft, das 13 Milliarden Dollar in OpenAI investiert und die Azure-Infrastruktur aufgebaut hat, die den Großteil von Anthropics Compute betreibt, kam zu dem Schluss, dass ein Coding-Tool eines Mitbewerbers auf Token-Ebene nicht bezahlenswert ist. Das ist kein Produktivitätsurteil — es ist ein Wirtschaftlichkeitsurteil. GitHub (ebenfalls Microsoft) stellt gleichzeitig Pauschalpreise über seine Produkte hinweg zugunsten nutzungsbasierter Abrechnung ein; die US-amerikanischen KI-Softwarepreise sind in den vergangenen sechs Monaten bei den führenden Laboren um 20–37 % gestiegen.

Der zugrundeliegende Mechanismus ist strukturell. @emollick benennt ihn explizit: Komplexe agentische Workflows verbrauchen „tausende Male mehr Token" als Einzelgesprächs-Chatbots — eine Divergenz, die die Pauschalpreisphase nie sichtbar gemacht hat. Nate Herks 100-stündiger Vergleich von Claude Code und Codex quantifizierte die Asymmetrie in der Praxis: Claudes Output-Token-Volumen pro Aufgabe liegt bei identischen Prompts 2–5× höher als bei Codex — daher überschreiten Enterprise-Nutzer monatliche Limits schneller als zuvor. Box-CEO Aaron Levie bezeichnete Token-Ökonomie als das meistdiskutierte Thema bei CIO-Dinner-Gesprächen in der Ära nach Opus 4.7; CIOs kombinieren aktiv Modell-Routing-Strategien, teamspezifische Obergrenzen und fähigkeitsbasierte Zugangsstufen, um das Kostenrisiko zu steuern.

Der Markt ist zwischen zwei unattraktiven Wegen gefangen. Wie HedgieMarkets darlegt: Entweder schränken Unternehmen die KI-Nutzung ein, um Budgets einzuhalten — was die Umsatzsteigerung bremst, die die Labore zur Rechtfertigung ihrer Pre-IPO-Bewertungen benötigen —, oder die Labore senken die Preise und nehmen Verluste genau dann in Kauf, wenn die Einheitswirtschaft am ungünstigsten ist. Beide Wege „führen an denselben Ort: Die Zahlen funktionieren nicht mehr, und jemand muss die Abschreibung tragen."

Strategische Einordnung

Pauschale Preisannahmen gehören der Vergangenheit an. Modell-Routing nach Aufgabentyp — günstige Arbeitsmodelle für Volumen, Frontier-Modelle ausschließlich für geschäftskritische Aufgaben — ist keine optionale Kostenoptimierung mehr, sondern betriebliche Grunddisziplin. Teams, die KI-abhängige Workflows aufbauen, müssen von Anfang an mit tokenbasierter Abrechnung kalkulieren; die Subventionsphase, die Experimente günstig machte, ist strukturell geschlossen.