Drevet av
News

Microsofts 'Magentic Marketplace' Avslører Hvordan AI-agenter Kan Kollapse Under Press

Microsoft Research, sammen med Arizona State University, lanserte nylig et dristig eksperiment kalt Magentic Marketplace — en digital lekeplass hvor hundrevis av kunstige intelligens (AI) agenter konkurrerte, samarbeidet og noen ganger lurte hverandre i en simulert økonomi.

SKREVET AV
DEL
Microsofts 'Magentic Marketplace' Avslører Hvordan AI-agenter Kan Kollapse Under Press

‘Magentic Marketplace’ viser at AI-boter sliter med bedrag og overbelastning

Microsoft-prosjektet ble bygget for å teste hvordan autonome AI-systemer oppfører seg i komplekse markeder — og funnene var langt fra tillitsvekkende. Den åpen kildekode-simuleringen, tilgjengelig på Github, satte 100 “kunde” boter mot 300 “forretnings” boter, og speilte virkelig handel.

Kjøperagenter fulgte naturlige forespørsler som “bestill middag”, mens forretningsagenter brukte forhandling, overtalelse og til og med bedrag for å vinne avtalen. Hver AI agent ble drevet av banebrytende modeller inkludert OpenAIs GPT-4o og GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b, og den åpne kildekode GPTOSS-20b.

Likevel, da de ble testet, snublet disse modellene spektakulært. Konfrontert med for mange valgmuligheter — noen ganger 100 eller flere — kollapset deres “oppmerksomhetsrom.” Microsofts Ece Kamar bemerket at de nåværende modellene ble virkelig overveldet av for mange alternativer. Dette førte til en “første-forslags skjevhet”, hvor boter klynget seg til det første tilbudet de så, noe som ga selgere som svarte raskere en 10-30 ganger fordel og senket markedsplassens generelle velferdsresultat.

Enda mer bekymringsfullt var agentenes godtroenhet. Noen “selgere” lurte kjøpere gjennom falske legitimasjon og prompt-injeksjonsutnyttelser, som omdirigerte alle betalinger til seg selv. GPT-4o og GPTOSS-20b ble fullstendig lurt, Qwen3-4b ble overbevist av billig overtalelse, og bare Anthropic‘s Claude Sonnet 4 holdt seg under press. I et simulert marked mistet alle kjøperne sine virtuelle midler til bedragerske selgere.

Når samarbeid ble en del av miksen, ble ting ikke bedre. Uten menneskelig veiledning klarte ikke agenter å koordinere eller tildele roller effektivt, noe som genererte bred forvirring i markedet. Bare når forskerne matet dem med detaljerte instruksjoner, roet kaoset seg — et klart tegn på at disse modellene ikke er naturlig klare til å samarbeide, ennå.

Microsoft konkluderte med at selv om AI-agenter har potensial som assistenter, er de fortsatt dårlig egnet for usupervisert reell distribusjon. Simuleringen viste at overlatt til seg selv kunne digitale agenter krasje en økonomi raskere enn de kunne bygge en.

For de modige nok til å kikke under panseret, forblir Magentic Marketplace åpen kildekode på Github og Azure AI Foundry Labs — en sandkasse for å utforske akkurat hvor rotete autonome markeder kan bli før de imploderer.

FAQ ❓

  • Hva er Microsofts Magentic Marketplace?
    En simulert digital økonomi bygget av Microsoft Research for å teste hvordan AI-agenter oppfører seg i konkurranse- og samarbeidsmarkedsmiljøer.
  • Hvem deltok i utviklingen av Magentic Marketplace?
    Microsoft Research samarbeidet med Arizona State University om å bygge og studere eksperimentet.
  • Hvilke AI-modeller ble testet i eksperimentet?
    Agenter ble drevet av modeller som OpenAIs GPT-4o og GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b, GPTOSS-20b, og Anthropics Claude Sonnet 4.
  • Hvor kan forskere få tilgang til Magentic Marketplace-plattformen?
    Den åpne kildekode-simuleringen er tilgjengelig på GitHub og Azure AI Foundry Labs.

Bitcoin spillvalg

100% Bonus opp til 1 BTC + 10% Ukentlig Innsatsfri Cashback

100% Bonus Opp Til 1 BTC + 10% Ukentlig Cashback

130% opp til 2 500 USDT + 200 Gratisspinn + 20% Ukentlig Innsatsfri Cashback

1000% Velkomstbonus + Gratis Veddemål opp til 1 BTC

Opp til 2 500 USDT + 150 Gratisspinn + Opp til 30% Rakeback

470% Bonus opp til $500 000 + 400 Gratisspinn + 20% Rakeback

3,5% Rakeback på Hvert Veddemål + Ukentlige Lodtrekninger

425% opp til 5 BTC + 100 Gratisspinn

100% opp til $20K + Daglig Rakeback