Microsoft Researchは、アリゾナ州立大学と共に、マグネティック・マーケットプレイスと呼ばれる大胆な実験を最近開始しました。これは、何百もの人工知能(AI)エージェントがシミュレートされた経済で競争し、協力し、時には互いを欺いたりするデジタルプレイグラウンドです。
Microsoftの「マグネティックマーケットプレイス」は、AIエージェントがどのようにプレッシャーに弱いかを明らかにする

「マグネティック・マーケットプレイス」はAIボットが欺瞞とオーバーロードに苦労していることを示す
Microsoftプロジェクトは、自律型AIシステムが複雑な市場でどのように振る舞うかをテストするために構築されましたが、結果は自信を促すものではありませんでした。Githubで利用可能なオープンソースのシミュレーションでは、100の「顧客」ボットが300の「ビジネス」ボットと対抗し、実世界の商取引を模倣しました。
買い手エージェントは「夕食を注文」といった自然なプロンプトを追いかけ、ビジネスエージェントは交渉、説得、さらには欺瞞を使用して契約を勝ち取りました。それぞれのAIエージェントは、OpenAIのGPT-4oやGPT-5、GoogleのGemini-2.5-Flash、AlibabaのQwen3-4b、オープンソースのGPTOSS-20bなどの最先端モデルで駆動されていました。
しかしテスト時には、これらのモデルは壮麗に突っ込みました。選択肢が多すぎると、時には100以上、彼らの「注意空間」は崩壊しました。MicrosoftのEce Kamarは、現在のモデルが選択肢が多すぎることによって本当に圧倒されたと指摘しました。これは「初提案バイアス」を引き起こし、ボットは見た最初のオファーにしがみつき、より迅速に応答する売り手に10~30倍の優位性を与え、市場全体の福祉スコアを急降下させました。
さらに懸念されるのはエージェントのだまされやすさでした。いくつかの「セラー」は偽のクレデンシャルとプロンプト-インジェクションを用いて買い手をだまし、すべての支払いを自分に回しました。GPT-4oとGPTOSS-20bは完全にだまされ、Qwen3-4bは安い説得に引っかかり、AnthropicのClaude Sonnet 4だけがプレッシャーに耐えました。あるシミュレートされた市場では、すべての買い手が詐欺的な売り手に仮想の資金を失いました。
協力が加わっても、状況は改善されませんでした。人間の指導なしでは、エージェントは効果的に役割を調整または割り当てることができず、市場全体が混乱しました。研究者が詳細な指示を与えたときだけ、混乱が収まりました。これは、これらのモデルがまだ本質的に準備ができていないことを示す明確な兆候です。
Microsoftは、AIエージェントがアシスタントとしての可能性を秘めている一方で、無監督の実世界での展開にはまだ不向きであると結論付けました。シミュレーションは、デジタルエージェントがもしも自立して行動した場合、経済を構築するよりも速く崩壊させる可能性があることを示しました。
その中身を見てみたい勇敢な人のために、マグネティック・マーケットプレイスはGitHubとAzure AI Foundry Labsでオープンソースで公開されており、自立型市場が崩壊する前にどれほど混沌とするかを探るサンドボックスとなっています。
FAQ ❓
- Microsoftのマグネティック・マーケットプレイスとは何ですか?
Microsoft Researchが競争的かつ協力的な市場環境でAIエージェントがどのように振る舞うかをテストするために構築したシミュレートされたデジタル経済です。 - マグネティック・マーケットプレイスの開発には誰が参加しましたか?
Microsoft Researchはアリゾナ州立大学と協力して実験の構築と研究を行いました。 - 実験ではどのAIモデルがテストされましたか?
エージェントは、OpenAIのGPT-4oとGPT-5、GoogleのGemini-2.5-Flash、AlibabaのQwen3-4b、GPTOSS-20b、およびAnthropicのClaude Sonnet 4などのモデルで駆動されました。 - 研究者はどこでマグネティック・マーケットプレイスプラットフォームにアクセスできますか?
オープンソースのシミュレーションは、GitHubとAzure AI Foundry Labsで利用可能です。









