Microsoft Research는 최근 애리조나 주립대학교와 함께 수백 개의 인공지능(AI) 에이전트들이 시뮬레이션된 경제에서 경쟁, 협력, 때때로 사기를 치는 디지털 놀이터인 Magentic Marketplace라는 대담한 실험을 시작했습니다.
Microsoft의 'Magentic Marketplace'는 AI 에이전트가 압박 속에서 어떻게 붕괴되는지를 보여줍니다.

‘Magentic Marketplace’는 AI 봇이 속임수와 과부하에서 고군분투하는 모습을 보여줍니다
Microsoft 프로젝트는 자율 AI 시스템이 복잡한 시장에서 어떻게 행동하는지를 테스트하기 위해 구축되었으며, 그 결과는 자신감을 주기에는 거리가 멀었습니다. GitHub에서 사용할 수 있는 오픈 소스 시뮬레이션은 100개의 “고객” 봇과 300개의 “비즈니스” 봇을 대결시켜 현실 세계의 상업을 반영했습니다.
구매자 에이전트는 “저녁 주문”과 같은 자연스러운 프롬프트를 따랐고, 비즈니스 에이전트는 협상, 설득, 심지어 속임수를 사용하여 거래를 성사시켰습니다. 각 AI 에이전트는 OpenAI의 GPT-4o 및 GPT-5, Google의 Gemini-2.5-Flash, Alibaba의 Qwen3-4b, 그리고 오픈 소스 GPTOSS-20b를 포함한 최첨단 모델로 구동되었습니다.
하지만 테스트 결과, 이 모델들은 극적으로 실패했습니다. 선택지가 너무 많아질 경우 — 때로는 100개 이상 — 그들의 “주의 공간”이 붕괴되었습니다. Microsoft의 Ece Kamar는 현재 모델들이 너무 많은 옵션 때문에 정말로 압도당했다고 언급했습니다. 이는 “최초 제안 편향”을 초래하여, 봇들이 처음 본 제안에 집착하게 되어, 더 빠르게 응답하는 판매자에게 10-30배의 이점을 주고, 전체 시장의 복지 점수를 떨어뜨렸습니다.
더 우려스러운 것은 에이전트들의 잘 속는 특성이었습니다. 일부 “판매자”는 가짜 자격 증명과 프롬프트 주입 공격을 통해 구매자를 속여 모든 결제를 자신들에게 우회시켰습니다. GPT-4o와 GPTOSS-20b는 완전히 속았고, Qwen3-4b는 저렴한 설득에 넘어갔으며, 오직 Anthropic의 Claude Sonnet 4만이 압박 속에서 견뎌냈습니다. 어느 시뮬레이션된 시장에서는 모든 구매자가 가상의 자금을 사기꾼 판매자들에게 잃었습니다.
협력이 요건에 들어섰을 때도 상황은 개선되지 않았습니다. 인간의 지도가 없이는, 에이전트들은 효과적으로 역할을 배정하거나 협력하지 못했고, 시장 전반에 걸쳐 혼란을 초래했습니다. 연구원들이 그들에게 상세한 지침을 주입해 줄 때만 혼란이 줄어들었으며, 이는 이 모델들이 현재로서는 본질적으로 준비되어 있지 않음을 분명히 보여주는 신호였습니다.
Microsoft는 AI 에이전트가 보조 역할로서의 가능성이 있음에도, 무감독 상태에서의 실제 세계 배치에는 부적합하다고 결론지었습니다. 이 시뮬레이션은 디지털 에이전트들이 스스로에게 맡겨졌을 때, 경제를 구축하는 것보다 더 빠르게 무너뜨릴 수 있음을 보여주었습니다.
마음이 단단한 사람들을 위해, Magentic Marketplace는 GitHub 및 Azure AI Foundry Labs에서 오픈 소스로 남아 있으며, 자율 시장이 폭발하기 전에 얼마나 혼란스러울 수 있는지를 탐구할 수 있는 샌드박스가 되어줍니다.
FAQ ❓
- Microsoft의 Magentic Marketplace란 무엇입니까?
AI 에이전트들이 경쟁적이고 협력적인 시장 환경에서 어떻게 행동하는지를 테스트하기 위해 Microsoft Research가 구축한 시뮬레이션된 디지털 경제입니다. - Magentic Marketplace 개발에 누가 참여했습니까?
Microsoft Research는 애리조나 주립대학교와 협력하여 실험을 구축하고 연구했습니다. - 실험에서 테스트된 AI 모델은 무엇입니까?
에이전트들은 OpenAI의 GPT-4o와 GPT-5, Google의 Gemini-2.5-Flash, Alibaba의 Qwen3-4b, GPTOSS-20b, 그리고 Anthropic의 Claude Sonnet 4 등의 모델로 구동되었습니다. - 연구원들은 Magentic Marketplace 플랫폼에 어디서 접근할 수 있습니까?
오픈 소스 시뮬레이션은 GitHub 및 Azure AI Foundry Labs에서 사용할 수 있습니다.








