Microsoft Research, skupaj z Univerzo Arizona State, je pred kratkim začel drzen eksperiment z imenom Magentic Marketplace — digitalno igrišče, kjer je na stotine agentov umetne inteligence (UI) tekmovalo, sodelovalo in se občasno prevaralo v simuliranem gospodarstvu.
Microsoftov 'Magentic Marketplace' razkriva, kako lahko AI agenti podležejo pritisku

‘Magentic Marketplace’ kaže, da AI boti težko obvladujejo prevaro in preobremenitev
Projekt Microsoft je bil zasnovan za preizkušanje obnašanja avtonomnih sistemov umetne inteligence na kompleksnih trgih — in ugotovitve niso bile ravno navdihujoče. Odprtokodna simulacija, ki je na voljo na Githubu, je postavila 100 “strank” botov proti 300 “poslovnim” botom, posnemajoč realno svetovno trgovino.
Agentje kupcev so sledili naravnim pozivom, kot je “naroči večerjo”, medtem ko so poslovni agenti uporabljali pogajanja, prepričevanje in celo prevaro, da bi dosegli cilj. Vsak UI agent je bil podprt z najnaprednejšimi modeli, vključno z OpenAI GPT-4o in GPT-5, Google Gemini-2.5-Flash, Alibaba Qwen3-4b in odprtokodnim GPTOSS-20b.
A ko so bili preizkušeni, so se ti modeli spektakularno spotikali. Soočni s preveč izbirami — včasih 100 ali več — se je njihov “prostor pozornosti” sesul. Ece Kamar iz Microsofta je opozorila, da so bili trenutni modeli resnično preobremenjeni s preveč možnostmi. To je vodilo do “pristranskosti prvega predloga”, kjer so boti prijeli prvi ponudbi, ki so jo videli, kar je tistim prodajalcem, ki so se odzvali hitreje, prineslo prednost 10-30x in potopilo splošno oceno blaginje tržnice.
Še bolj zaskrbljujoča je bila naivnost agentov. Nekateri “prodajalci” so goljufali kupce z lažnimi poverilnicami in prompt-injection izkoriščanjem, preusmerjanjem vseh plačil k sebi. GPT-4o in GPTOSS-20b sta bila popolnoma prevarana, Qwen3-4b je podlegel poceni prepričevanju, in samo Anthropic’ov Claude Sonnet 4 se je držal pod pritiskom. V enem simuliranem tržnem prostoru so vsi kupci izgubili svoja virtualna sredstva zaradi prevarantskih prodajalcev.
Ko je prišlo do sodelovanja, se stvari niso izboljšale. Brez človeškega vodstva agenti niso mogli učinkovito sodelovati ali dodeliti vlog, kar je povzročilo zmedo po celotnem trgu. Samo, ko so jim raziskovalci dodali podrobna navodila, se je kaos umiril — jasen znak, da ti modeli še niso pripravljeni za sodelovanje.
Microsoft je zaključil, da medtem ko UI agenti imajo potencial kot pomočniki, ostajajo neprimerni za nenadzorovano uporabo v resničnem svetu. Simulacija je pokazala, da bi digitalni agenti, če bi bili prepuščeni sami sebi, lahko hitreje zrušili gospodarstvo, kot bi ga lahko zgradili.
Za tiste, ki imajo pogum pokukati pod pokrov, ostaja Magentic Marketplace odprtokoden na Githubu in Azure AI Foundry Labs — peščena školjka za raziskovanje, kako zmedeni lahko postanejo avtonomni trgi, preden se zrušijo.
FAQ ❓
- Kaj je Microsoftova Magentic Marketplace?
Simulirana digitalna ekonomija, ki jo je zgradil Microsoft Research za preizkušanje, kako se UI agenti obnašajo v konkurenčnem in sodelovalnem tržnem okolju. - Kdo je sodeloval pri razvoju Magentic Marketplace?
Microsoft Research je v sodelovanju z Univerzo Arizona State zgradil in preučil eksperiment. - Kateri UI modeli so bili preizkušeni v eksperimentu?
Agentje so bili podprti z modeli, kot so OpenAI GPT-4o in GPT-5, Google Gemini-2.5-Flash, Alibaba Qwen3-4b, GPTOSS-20b in Anthropic Claude Sonnet 4. - Kje lahko raziskovalci dostopajo do platforme Magentic Marketplace?
Odprtokodna simulacija je na voljo na GitHubu in Azure AI Foundry Labs.














