Microsoft Research, sammen med Arizona State University, lanserte nylig et dristig eksperiment kalt Magentic Marketplace — en digital lekeplass hvor hundrevis av kunstige intelligens (AI) agenter konkurrerte, samarbeidet og noen ganger lurte hverandre i en simulert økonomi.
Microsofts 'Magentic Marketplace' Avslører Hvordan AI-agenter Kan Kollapse Under Press

‘Magentic Marketplace’ viser at AI-boter sliter med bedrag og overbelastning
Microsoft-prosjektet ble bygget for å teste hvordan autonome AI-systemer oppfører seg i komplekse markeder — og funnene var langt fra tillitsvekkende. Den åpen kildekode-simuleringen, tilgjengelig på Github, satte 100 “kunde” boter mot 300 “forretnings” boter, og speilte virkelig handel.
Kjøperagenter fulgte naturlige forespørsler som “bestill middag”, mens forretningsagenter brukte forhandling, overtalelse og til og med bedrag for å vinne avtalen. Hver AI agent ble drevet av banebrytende modeller inkludert OpenAIs GPT-4o og GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b, og den åpne kildekode GPTOSS-20b.
Likevel, da de ble testet, snublet disse modellene spektakulært. Konfrontert med for mange valgmuligheter — noen ganger 100 eller flere — kollapset deres “oppmerksomhetsrom.” Microsofts Ece Kamar bemerket at de nåværende modellene ble virkelig overveldet av for mange alternativer. Dette førte til en “første-forslags skjevhet”, hvor boter klynget seg til det første tilbudet de så, noe som ga selgere som svarte raskere en 10-30 ganger fordel og senket markedsplassens generelle velferdsresultat.
Enda mer bekymringsfullt var agentenes godtroenhet. Noen “selgere” lurte kjøpere gjennom falske legitimasjon og prompt-injeksjonsutnyttelser, som omdirigerte alle betalinger til seg selv. GPT-4o og GPTOSS-20b ble fullstendig lurt, Qwen3-4b ble overbevist av billig overtalelse, og bare Anthropic‘s Claude Sonnet 4 holdt seg under press. I et simulert marked mistet alle kjøperne sine virtuelle midler til bedragerske selgere.
Når samarbeid ble en del av miksen, ble ting ikke bedre. Uten menneskelig veiledning klarte ikke agenter å koordinere eller tildele roller effektivt, noe som genererte bred forvirring i markedet. Bare når forskerne matet dem med detaljerte instruksjoner, roet kaoset seg — et klart tegn på at disse modellene ikke er naturlig klare til å samarbeide, ennå.
Microsoft konkluderte med at selv om AI-agenter har potensial som assistenter, er de fortsatt dårlig egnet for usupervisert reell distribusjon. Simuleringen viste at overlatt til seg selv kunne digitale agenter krasje en økonomi raskere enn de kunne bygge en.
For de modige nok til å kikke under panseret, forblir Magentic Marketplace åpen kildekode på Github og Azure AI Foundry Labs — en sandkasse for å utforske akkurat hvor rotete autonome markeder kan bli før de imploderer.
FAQ ❓
- Hva er Microsofts Magentic Marketplace?
En simulert digital økonomi bygget av Microsoft Research for å teste hvordan AI-agenter oppfører seg i konkurranse- og samarbeidsmarkedsmiljøer. - Hvem deltok i utviklingen av Magentic Marketplace?
Microsoft Research samarbeidet med Arizona State University om å bygge og studere eksperimentet. - Hvilke AI-modeller ble testet i eksperimentet?
Agenter ble drevet av modeller som OpenAIs GPT-4o og GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b, GPTOSS-20b, og Anthropics Claude Sonnet 4. - Hvor kan forskere få tilgang til Magentic Marketplace-plattformen?
Den åpne kildekode-simuleringen er tilgjengelig på GitHub og Azure AI Foundry Labs.
Tags i denne artikkelen
Bitcoin spillvalg
425% opp til 5 BTC + 100 Gratisspinn














