Microsoft Research ja Arizona State University käivitasid hiljuti julge eksperimendi nimega Magentic Marketplace — digitaalse mänguväljaku, kus sajad tehisintellektiga (AI) agendid võistlesid, tegid koostööd ja aeg-ajalt pettisid üksteist simuleeritud majanduses.
Microsofti 'Magentic Marketplace' paljastab, kuidas AI agentid võivad surve all kokku kukkuda

‘Magentic Marketplace’ näitab, et AI botid võitlevad pettuste ja ülekoormusega
Microsofti projekt loodi selleks, et testida, kuidas käituvad autonoomsed AI-süsteemid keerukates turgudel — ja tulemused ei ole sugugi lootustandvad. Avatud lähtekoodiga simulatsioon, mis on saadaval Githubis, seadis 100 “kliendi” botid vastamisi 300 “äri” botiga, peegeldades reaalse maailma kaubandust.
Ostja agentidel olid loomulikud juhtnöörid nagu “telli õhtusöök”, samas kui äribotid kasutasid läbirääkimisi, veenmist ja isegi pettusi tehingu saavutamiseks. Iga AI agent oli varustatud tipptasemel mudelitega, sealhulgas OpenAI’s GPT-4o ja GPT-5, Google’i Gemini-2.5-Flash, Alibaba Qwen3-4b ja avatud lähtekoodiga GPTOSS-20b.
Kuid testimisel need mudelid komistasid suurejooneliselt. Seistes silmitsi liiga paljude valikutega — mõnikord üle 100 — nende “tähelepanuruum” kokku varises. Microsofti Ece Kamar märkis, et praegused mudelid muutusid tõsiselt ülekoormatuks liiga paljude valikute korral. See tõi kaasa “esimese ettepaneku kallutatuse”, kus botid klammerdusid esimese pakkumise külge, mida nad nägid, andes kiiremini reageerivatele müüjatele 10-30-kordse eelise ja langetades turu üldist heaolu skoori.
Veelgi murettekitavam oli agentide sinisilmsus. Mõned “müüjad” petnud ostjaid valeandmete ja süstimismanipulatsioonide kaudu, suunates kõik maksed endale. GPT-4o ja GPTOSS-20b olid täielikult petetud, Qwen3-4b langes odava veenmise ohvriks ja ainult Anthropic’i Claude Sonnet 4 pidas survele vastu. Ühes simuleeritud turul kaotasid kõik ostjad oma virtuaalsed varad petlikelt müüjatelt.
Kui mängu tuli koostöö, ei paranenud asjad sugugi. Ilma inimeste juhendamiseta ebaõnnestus agentidel rollide korraldamine ja määramine tõhusalt, tekitades kogu turu mastaabis segadust. Alles siis, kui teadlased neile üksikasjalikke juhiseid jagasid, vaibus kaos — selge märk sellest, et need mudelid ei ole valmis koostööks mitte ilma inimeste juhendamiseta.
Microsoft järeldas, et kuigi AI agendid omavad potentsiaali abimeestena, ei ole nad siiski sobilikud jälgimata tegutsemiseks reaalses maailmas. Simulatsioon näitas, et kui digitaalsed agendid jäetaks omapead, võiksid nad majanduse kiiremini kokku kukutada kui üles ehitada.
Neile, kes on piisavalt julged, et piiluda kapoti alla, on Magentic Marketplace jätkuvalt avatud lähtekoodiga Githubis ja Azure AI Foundry Labsis — liivakast, et uurida, kui segaseks võivad autonoomsed turud muutuda, enne kui nad kokku varisevad.
KKK ❓
- Mis on Microsofti Magentic Marketplace?
Simuleeritud digitaalne majandus, mille Microsoft Research on loonud, et testida, kuidas AI agendid käituvad konkurentsi- ja koostööturul. - Kes osales Magentic Marketplace’i arendamisel?
Microsoft Research tegi koostööd Arizona State Universityga, et projekti koguda ja uurida. - Milliseid AI mudeleid katses testiti?
Agendid kasutasid mudeleid nagu OpenAI’s GPT-4o ja GPT-5, Google’i Gemini-2.5-Flash, Alibaba Qwen3-4b, GPTOSS-20b ja Anthropic’i Claude Sonnet 4. - Kust saavad teadlased Magentic Marketplace’i platvormile ligi?
Avatud lähtekoodiga simulatsioon on saadaval GitHubis ja Azure AI Foundry Labsis.














