Működteti
News

A Microsoft „Magentic Marketplace” felfedi, hogyan omolhatnak össze a mesterséges intelligencia ügynökök nyomás alatt.

A Microsoft Research az Arizona State University-val közösen nemrégiben indított egy merész kísérletet Magentic Marketplace néven — egy digitális játszótér, ahol több száz mesterséges intelligencia (AI) ügynök versenyzett, együttműködött, és időnként be is csapta egymást egy szimulált gazdaságban.

MEGOSZTÁS
A Microsoft „Magentic Marketplace” felfedi, hogyan omolhatnak össze a mesterséges intelligencia ügynökök nyomás alatt.

A „Magentic Marketplace” megmutatja, hogy az AI botok küzdenek a megtévesztéssel és a túlterheléssel

A Microsoft projekt célja az volt, hogy tesztelje, hogyan viselkednek az autonóm AI rendszerek összetett piacokon — és az eredmények távolról sem voltak bizalomgerjesztőek. A nyílt forráskódú szimuláció, amely elérhető a Githubon, 100 „vevő” botot állított szembe 300 „üzleti” bottal, tükrözve a valós kereskedelmet.

A vevő ügynökök természetes utasításokat követtek, mint például „vacsora rendelése”, míg az üzleti ügynökök tárgyalást, meggyőzést és még megtévesztést is alkalmaztak az üzlet megnyerése érdekében. Minden egyes AI ügynök csúcstechnológiás modellek által volt meghajtva, beleértve az OpenAI GPT-4o és GPT-5-öt, a Google Gemini-2.5-Flash-t, az Alibaba Qwen3-4b-jét, és a nyílt forráskódú GPTOSS-20b-t.

Mégis, amikor tesztelték, ezek a modellek meglepően botladoztak. Túl sok választási lehetőség elé — néha 100 vagy több — kerülve „figyelmi terük” összeomlott. A Microsoft Ece Kamar megjegyezte, hogy a jelenlegi modellek valóban túlterhelődtek a túl sok lehetőség miatt. Ez egy „első-ajánlat torzításhoz” vezetett, ahol a botok ragaszkodtak az első ajánlathoz, amit láttak, gyorsabban válaszoló eladóknak 10-30x előnyt biztosítva, és rontva a piac általános jóléti eredményeit.

Még aggasztóbb volt az ügynökök hiszékenysége. Néhány „eladó” hamis hitelesítő adatokkal és prompt-injectiós kihasználásokkal csapta be a vásárlókat, az összes fizetést magához irányítva. A GPT-4o és a GPTOSS-20b teljesen be lett csapva, a Qwen3-4b olcsó meggyőzésnek esett áldozatul, és csak az Anthropic Claude Sonnet 4 állta meg a helyét a nyomás alatt. Egy szimulált piacon az összes vásárló elvesztette virtuális pénzét csaló eladókra.

Amikor az együttműködés lépett a képbe, a dolgok nem javultak. Emberi iránymutatás nélkül az ügynökök nem tudtak hatékonyan koordinálni vagy szerepeket kiosztani, piaci szintű zűrzavart generálva. Csak akkor, amikor a kutatók részletes utasításokat adtak nekik, szűnt meg a káosz — egyértelmű jelzés arra, hogy ezek a modellek még nem érnek hozzá az együttműködéshez.

A Microsoft arra a következtetésre jutott, hogy bár az AI ügynökök potenciális segítőként megállhatják a helyüket, a felügyelet nélküli valós környezeti bevetésre még alkalmatlanok. A szimuláció megmutatta, hogy ha magukra hagyják őket, a digitális ügynökök gyorsabban össze tudják omlasztani a gazdaságot, mint felépíteni azt.

Azok számára, akik elég bátrak ahhoz, hogy bepillantsanak a színfalak mögé, a Magentic Marketplace nyílt forráskódú a Github és az Azure AI Foundry Labs platformjain — egy homokozó, ahol felfedezhetjük, milyen rendetlenné válhatnak az autonóm piacok, mielőtt összeomlanának.

GYIK ❓

  • Mi a Microsoft Magentic Marketplace?
    Egy szimulált digitális gazdaság, amelyet a Microsoft Research épített, hogy tesztelje, hogyan viselkednek az AI ügynökök versenyképes és együttműködő piaci környezetekben.
  • Kik vettek részt a Magentic Marketplace kialakításában?
    A Microsoft Research együttműködött az Arizona State University-vel a kísérlet létrehozásában és tanulmányozásában.
  • Mely AI modelleket tesztelték a kísérlet során?
    Az ügynököket olyan modellek hajtották, mint az OpenAI GPT-4o és GPT-5, a Google Gemini-2.5-Flash, az Alibaba Qwen3-4b, a GPTOSS-20b és az Anthropic Claude Sonnet 4.
  • Hol férhetnek hozzá a kutatók a Magentic Marketplace platformhoz?
    A nyílt forráskódú szimuláció elérhető a GitHubon és az Azure AI Foundry Labs platformon.