MIT: KI-Agenten in Lieferketten übertreffen Menschen, erzeugen aber systemischen Bullwhip-Effekt

MIT-Forschende setzen reasoning-basierte KI-Agenten in der Beer-Game-Lieferkettensimulation ein und zeigen, dass diese die Kosten gegenüber menschlichen Teams um bis zu 67 % senken – zugleich aber eine neue Fehlerart einführen: Entscheidungs-Varianzamplifikation über mehrere Wertschöpfungsstufen hinweg, bezeichnet als Agenten-Bullwhip-Effekt. Wiederholtes Sampling kann diesen Effekt nicht beheben, da die Amplifikation der Multi-Agenten-Koordination mit Informationsverzögerungen inhärent ist. GRPO-Post-Training mit systemweiten – nicht agentenindividuellen – Belohnungen reduziert den Effekt wirksam.

Warum das wichtig ist

Der Agenten-Bullwhip-Effekt verallgemeinert sich über Lieferketten hinaus auf jede Multi-Agenten-Pipeline, in der Agenten unterschiedlicher Ebenen unter Informationsverzögerung koordinieren – einschließlich orchestrierter agentischer Workflows. Dies ist eine empirische Warnung: Die lokale Optimierung einzelner Agenten garantiert keine systemweite Stabilität.