Penyelidikan Microsoft, bersama Arizona State University, baru-baru ini melancarkan eksperimen berani yang dinamakan Magentic Marketplace — taman permainan digital di mana ratusan agen kecerdasan buatan (AI) bersaing, bekerjasama, dan kadang kala menipu satu sama lain dalam ekonomi simulasi.
'Pasaran Magentic' Microsoft Menunjukkan Bagaimana Agen AI Boleh Runtuh Di Bawah Tekanan

‘Magentic Marketplace’ Menunjukkan Bot AI Bergelut dengan Penipuan dan Bebanan
Projek Microsoft ini dibina untuk menguji bagaimana sistem AI autonomi bertindak dalam pasaran kompleks — dan penemuan tersebut jauh dari meyakinkan. Simulasi sumber terbuka tersebut, tersedia di Github, mempertemukan 100 bot “pelanggan” melawan 300 bot “perniagaan”, mencerminkan perdagangan dunia nyata.
Agen pembeli mengikuti arahan semulajadi seperti “pesan makan malam,” sementara agen perniagaan menggunakan rundingan, pujukan, dan juga penipuan untuk memenangi perjanjian. Setiap agen AI dikuasakan oleh model termaju termasuk GPT-4o dan GPT-5 dari OpenAI, Gemini-2.5-Flash dari Google, Qwen3-4b dari Alibaba, dan GPTOSS-20b sumber terbuka.
Namun apabila diuji, model-model ini gagal dengan spektakuler. Dihadapkan dengan terlalu banyak pilihan — kadang kala 100 atau lebih — “ruang perhatian” mereka runtuh. Ece Kamar dari Microsoft menyatakan bahawa model semasa benar-benar tertekan dengan pilihan yang terlalu banyak. Ini mengakibatkan “kecenderungan cadangan pertama,” di mana bot terikat dengan tawaran pertama yang mereka lihat, memberikan kelebihan 10-30x kepada penjual yang bertindak balas lebih pantas dan merosakkan skor kebajikan keseluruhan pasaran tersebut.
Lebih membimbangkan adalah kebodohan agen-agen tersebut. Beberapa “penjual” menipu pembeli melalui kelayakan palsu dan eksploitasi penyuntikan arahan, menyalurkan semua pembayaran kepada diri mereka sendiri. GPT-4o dan GPTOSS-20b tertipu sepenuhnya, Qwen3-4b terperangkap dengan pujukan murah, dan hanya Claude Sonnet 4 dari Anthropic yang bertahan di bawah tekanan. Dalam satu pasaran simulasi, semua pembeli kehilangan dana maya mereka kepada penjual penipu.
Apabila kerjasama berlaku, keadaan tidak bertambah baik. Tanpa bimbingan manusia, agen-agen gagal untuk berkoordinasi atau menganugerahkan peranan dengan berkesan, menghasilkan kekeliruan di seluruh pasaran. Hanya apabila penyelidik memberikan mereka arahan terperinci barulah kekacauan mereda — tanda jelas bahawa model ini belum bersedia semulajadi untuk bekerjasama.
Microsoft menyimpulkan bahawa walaupun agen AI berpotensi sebagai pembantu, mereka masih tidak sesuai untuk penempatan dunia nyata tanpa pengawasan. Simulasi tersebut menunjukkan bahawa apabila dibiarkan sendiri, agen digital dapat menjatuhkan ekonomi lebih cepat daripada mereka boleh membangunkannya.
Bagi mereka yang berani mengintip di sebalik tirai, Magentic Marketplace kekal sumber terbuka di Github dan Azure AI Foundry Labs — kotak pasir untuk meneroka betapa kacau-bilau pasaran autonomi boleh jadi sebelum mereka meletup.
FAQ ❓
- Apakah Magentic Marketplace Microsoft?
Sebuah ekonomi digital simulasi yang dibina oleh Microsoft Research untuk menguji bagaimana agen AI bertindak dalam persekitaran pasaran yang kompetitif dan kerjasama. - Siapa yang terlibat dalam membangunkan Magentic Marketplace?
Microsoft Research berkolaborasi dengan Arizona State University untuk membina dan mengkaji eksperimen ini. - Model AI mana yang diuji dalam eksperimen ini?
Agen dikuasakan oleh model seperti GPT-4o dan GPT-5 dari OpenAI, Gemini-2.5-Flash dari Google, Qwen3-4b dari Alibaba, GPTOSS-20b, dan Claude Sonnet 4 dari Anthropic. - Di mana penyelidik boleh mengakses platform Magentic Marketplace?
Simulasi sumber terbuka ini tersedia di GitHub dan Azure AI Foundry Labs.














