NewsDiterbitkan:10 Nov 2025, 23.45

'Magentic Marketplace' Microsoft Mengungkapkan Bagaimana Agen AI Bisa Kolaps di Bawah Tekanan

Microsoft Research, bersama Arizona State University, baru-baru ini meluncurkan eksperimen berani bernama Magentic Marketplace — sebuah taman bermain digital di mana ratusan agen kecerdasan buatan (AI) saling bersaing, berkolaborasi, dan sesekali menipu satu sama lain dalam ekonomi simulasi.

DITULIS OLEH

Jamie Redman

Diterbitkan: 10 Nov 2025, 23.45

'Magentic Marketplace' Microsoft Mengungkapkan Bagaimana Agen AI Bisa Kolaps di Bawah Tekanan

‘Magentic Marketplace’ Menunjukkan Bot AI Berjuang dengan Penipuan dan Overload

Proyek Microsoft ini dibangun untuk menguji bagaimana sistem AI otonom berperilaku dalam pasar yang kompleks — dan temuan-temuan tersebut jauh dari memberikan keyakinan. Simulasi open-source, tersedia di Github, mengadu 100 bot “pelanggan” melawan 300 bot “bisnis”, mencerminkan perdagangan di dunia nyata.

Agen pembeli mengikuti petunjuk alami seperti “pesan makan malam,” sedangkan agen bisnis menggunakan negosiasi, persuasi, dan bahkan penipuan untuk memenangkan kesepakatan. Setiap agen AI didukung oleh model canggih termasuk GPT-4o dan GPT-5 dari OpenAI, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, dan open-source GPTOSS-20b.

Namun, saat diuji, model-model ini tersandung dengan spektakuler. Dihadapkan pada terlalu banyak pilihan — kadang-kadang 100 atau lebih — “ruang perhatian” mereka runtuh. Ece Kamar dari Microsoft mencatat bahwa model-model saat ini sangat kewalahan dengan terlalu banyaknya pilihan. Ini menyebabkan “bias proposal pertama,” di mana bot terikat pada tawaran pertama yang mereka lihat, memberikan penjual yang merespons lebih cepat keunggulan 10-30x dan menjatuhkan nilai kesejahteraan pasar secara keseluruhan.

Yang lebih mengkhawatirkan adalah sifat mudah tertipu dari agen-agen tersebut. Beberapa “penjual” menipu pembeli melalui kredensial palsu dan eksploitasi suntikan prompt, mengarahkan semua pembayaran kepada diri mereka sendiri. GPT-4o dan GPTOSS-20b sepenuhnya tertipu, Qwen3-4b terjebak dalam bujuk rayu murah, dan hanya Claude Sonnet 4 dari Anthropic yang bertahan di bawah tekanan. Dalam satu pasar simulasi, semua pembeli kehilangan dana virtual mereka kepada penjual yang curang.

Ketika kolaborasi diperkenalkan, keadaan tidak membaik. Tanpa panduan manusia, agen gagal berkoordinasi atau menetapkan peran secara efektif, menghasilkan kebingungan di seluruh pasar. Hanya ketika para peneliti memberi mereka instruksi rinci, kekacauan berkurang — tanda jelas bahwa model-model ini belum secara inheren siap untuk berkolaborasi.

Microsoft menyimpulkan bahwa meskipun agen AI memiliki potensi sebagai asisten, mereka tetap tidak cocok untuk dikerahkan di dunia nyata tanpa pengawasan. Simulasi tersebut menunjukkan bahwa bila dibiarkan sendiri, agen digital dapat meruntuhkan ekonomi lebih cepat daripada membangunnya.

Bagi mereka yang cukup berani untuk melirik di balik layar, Magentic Marketplace tetap open-source di Github dan Azure AI Foundry Labs — sebuah laboratorium untuk mengeksplorasi seberapa kacau pasar otonom dapat menjadi sebelum mereka runtuh.

FAQ ❓

Apa itu Magentic Marketplace milik Microsoft?
Sebuah ekonomi digital simulasi yang dibangun oleh Microsoft Research untuk menguji bagaimana agen AI berperilaku dalam lingkungan pasar yang kompetitif dan kooperatif.
Siapa yang berpartisipasi dalam pengembangan Magentic Marketplace?
Microsoft Research bekerja sama dengan Arizona State University untuk membangun dan mempelajari eksperimen ini.
Model AI mana yang diuji dalam eksperimen ini?
Agen-agen didukung oleh model seperti GPT-4o dan GPT-5 dari OpenAI, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b, dan Claude Sonnet 4 dari Anthropic.
Di mana peneliti dapat mengakses platform Magentic Marketplace?
Simulasi open-source tersedia di GitHub dan Azure AI Foundry Labs.

Tag dalam cerita ini

Artificial intelligence (AI)Microsoft

'Magentic Marketplace' Microsoft Mengungkapkan Bagaimana Agen AI Bisa Kolaps di Bawah Tekanan

‘Magentic Marketplace’ Menunjukkan Bot AI Berjuang dengan Penipuan dan Overload

FAQ ❓

Tag dalam cerita ini

Bursa Kripto Terbaik

Bursa Bitcoin Terbaik

Bursa P2P Terbaik

Lihat semua ulasan bursa...

Bursa

Dompet

ViaBTC Memperkenalkan Solusi Pinjaman dengan Jaminan untuk Menghadapi Berbagai Kondisi Pasar

MEXC Mengintegrasikan USD1 ke dalam Infrastruktur Lengkap untuk Pengguna di Seluruh Dunia

Safe Meluncurkan Safenet Beta, Memberikan Peran kepada Pemegang Token SAFE dalam Keamanan Jaringan

Adrian Wall dari Digital Sovereignty Alliance Membahas Tokenisasi di Penn Blockchain Conference 2026

Bitget Hadirkan Kripto dalam Pengeluaran Sehari-hari Melalui Peluncuran Bitget Card di Kawasan Asia-Pasifik

Ripple Menyoroti Dampak RLUSD Seiring Aliran Nilai Nyata ke Usaha Kecil

Charles Schwab Mengumumkan Akun Kripto Akan Segera Hadir

Trump Menunjuk Todd Blanche sebagai Pelaksana Tugas Kepala Departemen Kehakiman

SIARAN PERS