NIST CAISI: DeepSeek V4 Pro liegt 8 Monate hinter US-KI-Modellen zurück

NISTs CAISI-Evaluierung ergibt, dass DeepSeek V4 Pro das bislang fähigste chinesische KI-Modell ist, jedoch in Capability-Benchmarks etwa acht Monate hinter führenden US-KI-Modellen zurückliegt – die erste offizielle Quantifizierung des US-chinesischen KI-Kompetenzgefälles durch die US-Regierung.

NIST CAISI: DeepSeek V4 Pro liegt acht Monate hinter US-KI-Modellen zurück

Das CAISI-Evaluierungsverfahren des National Institute of Standards and Technology (NIST) hat ergeben, dass DeepSeek V4 Pro das bislang fähigste chinesische KI-Modell ist – in den Capability-Benchmarks liegt es jedoch etwa acht Monate hinter führenden US-KI-Modellen zurück. Es handelt sich um die erste offizielle Quantifizierung des US-chinesischen KI-Kompetenzgefälles durch die US-Regierung auf Basis eines standardisierten Evaluierungsrahmens. Der CAISI-Benchmark (Comprehensive AI Systems Intelligence) umfasst Reasoning-, Coding- und multimodale Aufgaben.

Einordnung

Eine staatlich herausgegebene Kompetenzlückenschätzung liefert Entscheidungsträgern eine konkrete – und öffentlich vertretbare – Kennzahl für die KI-Wettbewerbsfähigkeitsdebatte: An die Stelle informeller Branchenvergleiche tritt erstmals ein offizieller Benchmark-Zeitplan.