NVIDIA-Forscher Jim Fan präsentiert Physical-AGI-Roadmap: WAM und DreamDojo
NVIDIA-Forscher Jim Fan skizzierte bei Sequoia AI Ascent eine Roadmap für Physical AGI und argumentierte, dass Vision-Language-Action-Modelle unzureichend seien. Er schlug World Action Models (WAM) als zweites Pretraining-Paradigma für Robotik vor — analog zum Erfolgspfad der LLMs. Ergänzende Arbeiten: EgoScale (ein Dexterity Scaling Law für Robotermanipulationsdaten) und DreamDojo, eine End-to-End-Neuralphysik-Engine zur Skalierung von Reinforcement Learning in silico, um die Sim-to-Real-Lücke zu schließen.
Bedeutung
Fans Ansatz folgt dem LLM-Playbook — massives Pretraining, Scaling Laws, Daten-Flywheels — angewendet auf physische KI. Sollte sich dies bestätigen, könnten WAM und DreamDojo für die Robotik leisten, was Transformer für Sprache geleistet haben: den Zeitplan für fähige, universell einsetzbare physische Agenten radikal verkürzen.