Microsoft Research, bersama Arizona State University, baru-baru ini meluncurkan eksperimen berani bernama Magentic Marketplace — sebuah taman bermain digital di mana ratusan agen kecerdasan buatan (AI) saling bersaing, berkolaborasi, dan sesekali menipu satu sama lain dalam ekonomi simulasi.
'Magentic Marketplace' Microsoft Mengungkapkan Bagaimana Agen AI Bisa Kolaps di Bawah Tekanan

‘Magentic Marketplace’ Menunjukkan Bot AI Berjuang dengan Penipuan dan Overload
Proyek Microsoft ini dibangun untuk menguji bagaimana sistem AI otonom berperilaku dalam pasar yang kompleks — dan temuan-temuan tersebut jauh dari memberikan keyakinan. Simulasi open-source, tersedia di Github, mengadu 100 bot “pelanggan” melawan 300 bot “bisnis”, mencerminkan perdagangan di dunia nyata.
Agen pembeli mengikuti petunjuk alami seperti “pesan makan malam,” sedangkan agen bisnis menggunakan negosiasi, persuasi, dan bahkan penipuan untuk memenangkan kesepakatan. Setiap agen AI didukung oleh model canggih termasuk GPT-4o dan GPT-5 dari OpenAI, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, dan open-source GPTOSS-20b.
Namun, saat diuji, model-model ini tersandung dengan spektakuler. Dihadapkan pada terlalu banyak pilihan — kadang-kadang 100 atau lebih — “ruang perhatian” mereka runtuh. Ece Kamar dari Microsoft mencatat bahwa model-model saat ini sangat kewalahan dengan terlalu banyaknya pilihan. Ini menyebabkan “bias proposal pertama,” di mana bot terikat pada tawaran pertama yang mereka lihat, memberikan penjual yang merespons lebih cepat keunggulan 10-30x dan menjatuhkan nilai kesejahteraan pasar secara keseluruhan.
Yang lebih mengkhawatirkan adalah sifat mudah tertipu dari agen-agen tersebut. Beberapa “penjual” menipu pembeli melalui kredensial palsu dan eksploitasi suntikan prompt, mengarahkan semua pembayaran kepada diri mereka sendiri. GPT-4o dan GPTOSS-20b sepenuhnya tertipu, Qwen3-4b terjebak dalam bujuk rayu murah, dan hanya Claude Sonnet 4 dari Anthropic yang bertahan di bawah tekanan. Dalam satu pasar simulasi, semua pembeli kehilangan dana virtual mereka kepada penjual yang curang.
Ketika kolaborasi diperkenalkan, keadaan tidak membaik. Tanpa panduan manusia, agen gagal berkoordinasi atau menetapkan peran secara efektif, menghasilkan kebingungan di seluruh pasar. Hanya ketika para peneliti memberi mereka instruksi rinci, kekacauan berkurang — tanda jelas bahwa model-model ini belum secara inheren siap untuk berkolaborasi.
Microsoft menyimpulkan bahwa meskipun agen AI memiliki potensi sebagai asisten, mereka tetap tidak cocok untuk dikerahkan di dunia nyata tanpa pengawasan. Simulasi tersebut menunjukkan bahwa bila dibiarkan sendiri, agen digital dapat meruntuhkan ekonomi lebih cepat daripada membangunnya.
Bagi mereka yang cukup berani untuk melirik di balik layar, Magentic Marketplace tetap open-source di Github dan Azure AI Foundry Labs — sebuah laboratorium untuk mengeksplorasi seberapa kacau pasar otonom dapat menjadi sebelum mereka runtuh.
FAQ ❓
- Apa itu Magentic Marketplace milik Microsoft?
Sebuah ekonomi digital simulasi yang dibangun oleh Microsoft Research untuk menguji bagaimana agen AI berperilaku dalam lingkungan pasar yang kompetitif dan kooperatif. - Siapa yang berpartisipasi dalam pengembangan Magentic Marketplace?
Microsoft Research bekerja sama dengan Arizona State University untuk membangun dan mempelajari eksperimen ini. - Model AI mana yang diuji dalam eksperimen ini?
Agen-agen didukung oleh model seperti GPT-4o dan GPT-5 dari OpenAI, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b, dan Claude Sonnet 4 dari Anthropic. - Di mana peneliti dapat mengakses platform Magentic Marketplace?
Simulasi open-source tersedia di GitHub dan Azure AI Foundry Labs.









