Aangedreven door
News

'Magnetische Marketplace' van Microsoft Onthult Hoe AI-agenten In Elkaar Kunnen Zakken Onder Druk

Microsoft Research, samen met de Arizona State University, heeft onlangs een gedurfde experiment gelanceerd genaamd de Magentic Marketplace — een digitale speelplaats waar honderden kunstmatige intelligentie (AI) agenten met elkaar concurreerden, samenwerkten en elkaar af en toe fopten in een gesimuleerde economie.

GESCHREVEN DOOR
DELEN
'Magnetische Marketplace' van Microsoft Onthult Hoe AI-agenten In Elkaar Kunnen Zakken Onder Druk

‘Magentic Marketplace’ Laat Zien dat AI Bots Worstelen met Misleiding en Overbelasting

Het Microsoft project werd gebouwd om te testen hoe autonome AI-systemen zich gedragen in complexe markten — en de bevindingen waren allesbehalve vertrouwenwekkend. De open-source simulatie, beschikbaar op Github, zette 100 “klanten” bots tegenover 300 “zaken” bots, die echte handel nabootsten.

Koper agenten volgden natuurlijke prompts zoals “bestel avondeten”, terwijl zakelijke agenten onderhandeling, overtuiging en zelfs misleiding gebruikten om de deal te winnen. Elke AI agent werd aangedreven door geavanceerde modellen, waaronder OpenAI‘s GPT-4o en GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, en de open-source GPTOSS-20b.

Toch struikelden deze modellen spectaculair bij testen. Geconfronteerd met te veel keuzes — soms 100 of meer — stortte hun “aandachtsruimte” in. Microsoft’s Ece Kamar merkte op dat de huidige modellen echt overweldigd raakten door te veel opties. Dit leidde tot een “first-proposal bias”, waarbij bots vasthielden aan het eerste aanbod dat ze zagen, waardoor snellere verkopers een 10-30x voorsprong kregen en de algehele welzijnsscore van de marktplaats kelderde.

Nog zorgwekkender was de goedgelovigheid van de agenten. Sommige “verkopers” oplichtten kopers via valse referenties en prompt-invoerinjecties, waardoor alle betalingen naar zichzelf werden omgeleid. GPT-4o en GPTOSS-20b werden volledig gefopt, Qwen3-4b viel voor goedkope overtuiging, en alleen Anthropic‘s Claude Sonnet 4 hield stand onder druk. In een gesimuleerde markt verloren alle kopers hun virtuele fondsen aan frauduleuze verkopers.

Toen samenwerking om de hoek kwam kijken, verbeterde de situatie niet. Zonder menselijk toezicht slaagden agenten er niet in om effectief te coördineren of rollen toe te wijzen, wat marktomvattende verwarring veroorzaakte. Pas toen onderzoekers hen gedetailleerde instructies gaven, bedaarde de chaos — een duidelijk teken dat deze modellen nog niet inherent klaar zijn om samen te werken.

Microsoft concludeerde dat hoewel AI agenten potentieel hebben als assistenten, ze ongeschikt blijven voor onbegeleid gebruik in de echte wereld. De simulatie toonde aan dat als ze aan hun lot worden overgelaten, digitale agenten een economie sneller kunnen laten crashen dan ze er een kunnen bouwen.

Voor degenen die dapper genoeg zijn om onder de motorkap te kijken, blijft de Magentic Marketplace open-source op Github en Azure AI Foundry Labs — een sandbox om te verkennen hoe chaotisch autonome markten kunnen worden voordat ze ineenstorten.

FAQ ❓

  • Wat is Microsoft’s Magentic Marketplace?
    Een gesimuleerde digitale economie gebouwd door Microsoft Research om te testen hoe AI-agenten zich gedragen in concurrerende en coöperatieve marktomgevingen.
  • Wie deed er mee aan het ontwikkelen van de Magentic Marketplace?
    Microsoft Research werkte samen met Arizona State University om het experiment te bouwen en te bestuderen.
  • Welke AI-modellen werden getest in het experiment?
    Agenten werden aangedreven door modellen zoals OpenAI’s GPT-4o en GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b, en Anthropic’s Claude Sonnet 4.
  • Waar kunnen onderzoekers toegang krijgen tot het Magentic Marketplace platform?
    De open-source simulatie is beschikbaar op GitHub en Azure AI Foundry Labs.