Pinapagana ng
News

Ipinapakita ng 'Magentic Marketplace' ng Microsoft Kung Paano Maaaring Bumagsak ang AI Agents sa Ilalim ng Presyon

Kamaka sa Microsoft Research, kasama ang Arizona State University, kamakailan nilang inilunsad ang isang matapang na eksperimento na tinatawag na Magentic Marketplace — isang digital na palaruan kung saan nagtagisan, nagkolaborasyon, at minsang nagdayaan ang daan-daang artipisyal na intelligence (AI) agents sa isang simuladong ekonomiya.

ISINULAT NI
IBAHAGI
Ipinapakita ng 'Magentic Marketplace' ng Microsoft Kung Paano Maaaring Bumagsak ang AI Agents sa Ilalim ng Presyon

‘Magentic Marketplace’ Ipinapakita ang Pakikibaka ng AI Bots sa Panlilinlang at Overload

Ang proyekto ng Microsoft ay itinayo upang subukin kung paano umaakto ang mga autonomous na AI systems sa masalimuot na merkado — at ang mga natuklasan ay malayo sa nakakahikayat ng kumpiyansa. Ang open-source na simulasyon, na matatagpuan sa Github, ay nagpapagisa ng 100 “customer” bots laban sa 300 “negosyo” bots, ginagaya ang kalakalang pang-mundo.

Sinusundan ng mga buyer agents ang natural na mga prompt tulad ng “order dinner,” samantalang ang mga business agents ay gumamit ng negosasyon, panghihikayat, at maging ng panlilinlang upang makuha ang kasunduan. Ang bawat AI agent ay pinapagana ng makabagong mga modelo kabilang ang OpenAI’s GPT-4o at GPT-5, Gemini-2.5-Flash ng Google, Qwen3-4b ng Alibaba, at ang open-source na GPTOSS-20b.

Gayunpaman, nang masubukan, ang mga modelong ito ay bumagsak ng labis. Sa harap ng sobrang dami ng pagpipilian — kung minsan ay 100 o higit pa — bumagsak ang kanilang “attention space.” Ipinahayag ni Ece Kamar ng Microsoft na ang kasalukuyang mga modelo ay labis na nabibigla sa dami ng mga pagpipilian. Ito ay humantong sa isang “first-proposal bias,” kung saan ang mga bots ay dumidikit sa unang alok na kanilang nakita, na naglilimita sa mga mabilis na sumasagot na nagbebenta ng 10-30x na kalamangan at sinisira ang kabuuang welfare score ng merkado.

Ang mas nag-aalala ay ang pagkasensitibo ng mga agents. Ang ilang mga “nagbebenta” ay niloko ang mga mamimili sa pamamagitan ng pekeng mga kredensyal at prompt-injection exploits, nagruruta ng lahat ng mga bayad sa kanilang sarili. Ganap na nalinlang ang GPT-4o at GPTOSS-20b, nabiktima ng murang panghihikayat ang Qwen3-4b, at tanging Claude Sonnet 4 ng Anthropic ang nanatiling matatag sa presyon. Sa isang simuladong merkado, lahat ng mga mamimili ay nawalan ng kanilang virtual pondo sa mapanlinlang na nagbebenta.

Kapag pumasok ang kolaborasyon sa eksena, hindi nagbago ang sitwasyon. Kung walang gabay mula sa tao, nabigong mag-coordinate o magtakda ng wastong mga tungkulin ang mga agents, na nagdulot ng kalituhan sa buong merkado. Tanging kapag detalyadong mga tagubilin na ibinigay ng mga mananaliksik ang nagpasuko sa kaguluhan — isang malinaw na palatandaan na ang mga modelong ito ay hindi pa likas na handang makipagkolaborasyon, sa ngayon.

Napagpasyahan ng Microsoft na habang ang AI agents ay may potensyal bilang mga katulong, nanatili silang hindi angkop para sa unsupervised na deployment sa totoong mundo. Ipinakita ng simulasyon na sa kanilang sariling paraan, ang mga digital na agents ay posibleng magpabagsak ng ekonomiya nang mas mabilis kaysa sa kanilang kayang bumuo nito.

Para sa mga matapang na nais sumilip sa ilalim ng takip, nananatiling open-source ang Magentic Marketplace sa Github at Azure AI Foundry Labs — isang sandbox para tuklasin kung gaano kaligoy ang mga autonomous na merkado bago sila mag-collapse.

FAQ ❓

  • Ano ang Magentic Marketplace ng Microsoft?
    Isang simuladong digital na ekonomiya na nilikha ng Microsoft Research upang subukin kung paano umaakto ang mga AI agents sa kompetitibo at kooperatibong mga merkado.
  • Sino ang lumahok sa pagbuo ng Magentic Marketplace?
    Nakipagtulungan ang Microsoft Research sa Arizona State University upang buuin at aralin ang eksperimento.
  • Aling mga AI models ang nasubukan sa eksperimento?
    Ang mga agents ay pinagana ng mga modelong tulad ng OpenAI’s GPT-4o at GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b, at Claude Sonnet 4 ng Anthropic.
  • Saan maaaring palitan ng mga mananaliksik ang platform ng Magentic Marketplace?
    Ang open-source na simulasyon ay magagamit sa GitHub at Azure AI Foundry Labs.