Google Gemma 4 E2B/E4B ermöglicht Agent-Skills auf Edge-Geräten via LiteRT-LM

Googles Gemma 4 E2B und E4B sind die ersten Modelle, die Function-Calling und Thinking in einem effektiven Parameterbereich von 2–4 Mrd. bündeln. Auf der AI Engineer Conference vorgestellt von Google AI Edge Tech Lead Cormac Brick, laufen die Modelle über die quelloffene LiteRT-LM-Runtime auf Android, iOS, macOS, Linux, Windows und IoT. Progressive-Disclosure-Skill-Loading erhält dabei die Reasoning-Qualität in kontextbeschränkten Umgebungen. Lizenziert unter Apache 2.0; die Begleit-App Google AI Edge Gallery ist ebenfalls Open Source.

Warum das wichtig ist

Agentic AI auf dem Gerät hat soeben eine bedeutsame Fähigkeitsschwelle überschritten. Der 2–4-Mrd.-Parameter-Bereich unterstützt nun echte Skill-Workflows — nicht nur Zusammenfassungen — und ermöglicht datenschutzkonforme, latenzfreie Agenten-Aufgaben ohne Cloud-Anbindung. NPU-Beschleunigung auf Qualcomm-Chips liefert dabei rund die zehnfache CPU-Durchsatzrate.