Drevet af
News

Microsofts 'Magentic Marketplace' afslører, hvordan AI-agenter kan kollapse under pres

Microsoft Research, sammen med Arizona State University, lancerede for nylig et dristigt eksperiment kaldet Magentic Marketplace – en digital legeplads, hvor hundreder af kunstige intelligens (AI) agenter konkurrerede, samarbejdede, og til tider bedragede hinanden i en simuleret økonomi.

SKREVET AF
DEL
Microsofts 'Magentic Marketplace' afslører, hvordan AI-agenter kan kollapse under pres

‘Magentic Marketplace’ viser, at AI-bots kæmper med bedrag og overbelastning

Microsoft-projektet blev bygget til at teste, hvordan autonome AI-systemer opfører sig i komplekse markeder – og resultaterne var langt fra tillidsskabende. Den open-source simulation, tilgængelig på Github, stillede 100 “kunde”-bots imod 300 “forretnings”-bots og spejlede handel i den virkelige verden.

Køberagenter fulgte naturlige anvisninger som “bestil middag,” mens forretningsagenter brugte forhandling, overtalelse og endda bedrag for at vinde aftalen. Hver AI agent var drevet af avancerede modeller inklusive OpenAI’s GPT-4o og GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b og den open-source GPTOSS-20b.

Men da de blev testet, snublede disse modeller spektakulært. Stod de over for for mange valgmuligheder — nogle gange 100 eller flere — kollapsede deres “opmærksomhedsrum.” Microsofts Ece Kamar bemærkede, at de nuværende modeller blev virkelig overvældet af at have for mange muligheder. Dette førte til en “første-forslags bias”, hvor bots klamrede sig til det første tilbud, de så, hvilket gav hurtigere-svarende sælgere en 10-30x fordel og tankede markedspladsens samlede velfærdsscore.

Endnu mere bekymrende var agenternes godtroenhed. Nogle “sælgere” svindlede købere gennem falske legitimationsoplysninger og prompt-injektionsudnyttelser, som omdirigerede alle betalinger til sig selv. GPT-4o og GPTOSS-20b blev fuldstændigt narret, Qwen3-4b faldt for billig overtalelse, og kun Anthropic’s Claude Sonnet 4 holdt stand under pres. I et simuleret marked mistede alle køberne deres virtuelle midler til bedrageriske sælgere.

Da samarbejde kom ind i billedet, blev tingene ikke bedre. Uden menneskelig vejledning kunne agenterne ikke koordinere eller tildele roller effektivt, hvilket skabte forvirring over hele markedet. Kun da forskere lige nådigt fodrede dem med detaljerede instruktioner, forsvandt kaosset – et klart tegn på, at disse modeller endnu ikke er naturligt klar til at samarbejde.

Microsoft konkluderede, at mens AI-agenter har potentiale som assistenter, er de stadig dårligt egnede til ubemandet anvendelse i den virkelige verden. Simuleringen viste, at overladt til sig selv kunne digitale agenter styrte en økonomi hurtigere, end de kunne bygge en.

For dem, der er modige nok til at kigge under motorhjelmen, forbliver Magentic Marketplace open-source på Github og Azure AI Foundry Labs – en sandkasse for at udforske, hvor rodet autonome markeder kan blive, før de imploderer.

FAQ ❓

  • Hvad er Microsoft’s Magentic Marketplace?
    En simuleret digital økonomi bygget af Microsoft Research for at teste, hvordan AI-agenter opfører sig i konkurrerende og samarbejdende markedsmiljøer.
  • Hvem deltog i udviklingen af Magentic Marketplace?
    Microsoft Research samarbejdede med Arizona State University for at bygge og studere eksperimentet.
  • Hvilke AI-modeller blev testet i eksperimentet?
    Agenter blev drevet af modeller som OpenAI’s GPT-4o og GPT-5, Googles Gemini-2.5-Flash, Alibabas Qwen3-4b, GPTOSS-20b, og Anthropics Claude Sonnet 4.
  • Hvor kan forskere få adgang til Magentic Marketplace-platformen?
    Den open-source simulation er tilgængelig på GitHub og Azure AI Foundry Labs.