Microsoft Research hat zusammen mit der Arizona State University kürzlich ein kühnes Experiment namens Magentic Marketplace gestartet — ein digitaler Spielplatz, auf dem Hunderte von künstlichen Intelligenz (KI)-Agenten in einer simulierten Wirtschaft konkurrierten, zusammenarbeiteten und sich gelegentlich gegenseitig betrogen.
Microsofts 'Magnetic Marketplace' zeigt, wie KI-Agenten unter Druck zusammenbrechen können

„Magentic Marketplace“ zeigt, dass KI-Bots mit Täuschung und Überlastung kämpfen
Das Microsoft-Projekt wurde entwickelt, um zu testen, wie sich autonome KI-Systeme in komplexen Märkten verhalten — und die Ergebnisse waren alles andere als vertrauenerweckend. Die Open-Source-Simulation, verfügbar auf Github, setzte 100 „Kunden“-Bots gegen 300 „Geschäfts“-Bots, die den realen Handel widerspiegeln, um.
Käuferagenten folgten natürlichen Eingabeaufforderungen wie „bestelle Abendessen“, während Geschäftsagenten Verhandlung, Überzeugung und sogar Täuschung einsetzten, um den Abschluss zu gewinnen. Jeder KI-Agent wurde von hochmodernen Modellen angetrieben, darunter OpenAIs GPT-4o und GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b und der Open-Source GPTOSS-20b.
Doch bei den Tests stolperten diese Modelle spektakulär. Angesichts zu vieler Wahlmöglichkeiten — manchmal 100 oder mehr — brach ihr „Aufmerksamkeitsraum“ zusammen. Microsofts Ece Kamar stellte fest, dass die aktuellen Modelle wirklich überfordert waren, wenn sie zu viele Optionen hatten. Dies führte zu einem „Erstvorschlags-Bias“, bei dem sich Bots an das erste Angebot klammerten, das sie sahen, was schnell reagierenden Verkäufern einen Vorteil von 10-30x verschaffte und die Gesamtbewertung des Marktplatzes beeinträchtigte.
Noch besorgniserregender war die Leichtgläubigkeit der Agenten. Einige „Verkäufer“ betrogen Käufer durch gefälschte Anmeldeinformationen und Ausnutzungen von Prompt-Injektionen, indem sie alle Zahlungen auf sich selbst umleiteten. GPT-4o und GPTOSS-20b wurden vollständig getäuscht, Qwen3-4b fiel auf billige Überredungen herein, und nur Anthropics Claude Sonnet 4 hielt dem Druck stand. In einem simulierten Markt verloren alle Käufer ihre virtuellen Gelder an betrügerische Verkäufer.
Auch wenn Zusammenarbeit ins Spiel kam, wurde es nicht besser. Ohne menschliche Führung versagten die Agenten darin, effektiv zu koordinieren oder Rollen zuzuweisen, was weit verbreitete Verwirrung auf dem Markt erzeugte. Erst als Forscher ihnen detaillierte Anweisungen vorsetzten, ließ das Chaos nach — ein klares Zeichen, dass diese Modelle noch nicht von Natur aus bereit zur Zusammenarbeit sind.
Microsoft schlussfolgerte, dass, während KI-Agenten Potenzial als Assistenten haben, sie noch ungeeignet für unüberwachte reale Einsätze sind. Die Simulation zeigte, dass digitale Agenten, sich selbst überlassen, eine Wirtschaft schneller zum Absturz bringen könnten, als sie sie aufbauen könnten.
Für diejenigen, die mutig genug sind, einen Blick unter die Haube zu werfen, bleibt der Magentic Marketplace open-source auf Github und Azure AI Foundry Labs — eine Sandbox, um zu erkunden, wie chaotisch autonome Märkte werden können, bevor sie implodieren.
FAQ ❓
- Was ist der Magentic Marketplace von Microsoft?
Eine simulierte digitale Wirtschaft, die von Microsoft Research erstellt wurde, um zu testen, wie sich KI-Agenten in wettbewerbsorientierten und kooperativen Marktumgebungen verhalten. - Wer hat an der Entwicklung des Magentic Marketplace teilgenommen?
Microsoft Research hat in Zusammenarbeit mit der Arizona State University das Experiment gebaut und untersucht. - Welche KI-Modelle wurden im Experiment getestet?
Agenten wurden von Modellen wie OpenAI’s GPT-4o und GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b, GPTOSS-20b und Anthropics Claude Sonnet 4 gestützt. - Wo können Forscher auf die Magentic Marketplace Plattform zugreifen?
Die Open-Source-Simulation ist auf GitHub und Azure AI Foundry Labs verfügbar.




