Karpathy und Thariq plädieren für HTML als neuen KI-Ausgabestandard

Das Argument von Anthropic-Ingenieur @theariq, dass HTML Markdown als Standard-Ausgabeformat von KI ersetzen solle, gewann am 12. Mai plattformübergreifend an Dynamik, als Andrej Karpathy es in einem zeitgleichen Tweet bekräftigte. Die These: Da Frontier-Modelle heute mühelos 500-Zeilen-Spezifikationen generieren, ist das Ausgabeformat zum Lesbarkeitsengpass geworden — nicht das Modell selbst. Vier unabhängige Quellen, darunter eine praktische Claude Code-Gegenüberstellung und ein Medium-Praktiker, der 20 HTML-Muster in neun Kategorien unter realen Bedingungen testete, bestätigen diese Einschätzung.

Was die Quellen tatsächlich sagen

Thariq stützt sein Argument auf fünf Säulen. Informationsdichte: HTMLs Vokabular — Tabellen, räumliche Layouts, Bilder, eingebettete Skripte und interaktive Steuerelemente — übertrifft Markdowns Bullet/Code-Block-Decke bei weitem; leistungsfähige Modelle improvisieren bereits um Markdowns Beschränkungen herum mit ASCII-Grafiken und Box-Drawing-Zeichen, ein „beeindruckender Workaround für ein Problem, das wir nicht haben müssten." Visuelle Übersichtlichkeit: Thariq gibt zu, dass er Markdown nach 100 Zeilen aufhört zu lesen — und Teammitglieder dazu ebenfalls nicht zu bewegen sind; HTML erschließt Tabs, klappbare Abschnitte, ankerverlinkte Inhaltsverzeichnisse und mobilresponsive Layouts. Teilbarkeit: HTML lässt sich auf jedem statischen Host als URL ablegen, die jeder Browser nativ öffnet — ohne spezielle Werkzeuge oder Editoren. Bidirektionale Interaktion: Schieberegler, Dropdowns und „Als Prompt kopieren"-Schaltflächen speisen Nutzeranpassungen direkt in Claude Code zurück und machen das Artefakt zur Schnittstelle selbst.

Die Demo des Onchain AI Garage macht den Unterschied empirisch sichtbar. Derselbe Vergleichsbericht-Prompt — in zwei parallelen Claude Code-Instanzen ausgeführt, eine auf Markdown, eine auf HTML ausgerichtet — produzierte eine Markdown-Version mit defekten ASCII-Diagrammen, falsch ausgerichteten Pfeilen und Textwänden ab Zeile 100, die niemand öffnet; sowie eine HTML-Version mit farbigen Vergleichstabellen, einem ankerverlinkten Inhaltsverzeichnis und syntaxhervorgehobenen Nebeneinander-Karten. Karpathys Tweet rahmt dies als eine Sprosse einer sechsstufigen Ausgabeformat-Entwicklung: Rohtext → Markdown (aktueller Standard) → HTML („früher neuer Standard, gerade jetzt") → … → diffusionsgeneriertes interaktives neuronales Video. Der Leitgedanke: Etwa ein Drittel des menschlichen Gehirns ist ein massiv paralleler visueller Prozessor — „der Kanal mit der höchsten Bandbreite ins Gehirn" — und KI-Output für diesen Kanal zu optimieren ist die langfristige architektonische Richtung.

Reale Kosten bestehen: 2- bis 4-fache Generierungszeit, einige Tausend zusätzliche Token (auf Millionen-Token-Kontexten kaum messbar) und unübersichtlichere Git-Diffs — der einzige Einwand, den Thariq direkt einräumt.

Strategische Einordnung

Für Teams, die Claude Code für Berichte, Spezifikationen oder Kundendokumente einsetzen, reduziert sich die praktische Änderung auf eine einzige angefügte Anweisung: „als HTML rendern." Kein neues Tooling erforderlich. Das übergeordnete Signal: Das Ausgabeformat ist eine Designentscheidung mit messbaren Lesbarkeitsfolgen — Teams, die es als solche behandeln, produzieren Artefakte, die Kollegen tatsächlich zu Ende lesen.