Microsoft Research, совместно с Университетом штата Аризона, недавно запустили смелый эксперимент под названием Magentic Marketplace — цифровую площадку, где сотни агентов с искусственным интеллектом (ИИ) соревновались, сотрудничали и иногда обманывали друг друга в симулированной экономике.
«Магнитный рынок» от Microsoft показывает, как агентам ИИ можно обрушиться под давлением

«Magentic Marketplace» показывает, что ИИ-боты испытывают трудности с обманом и перегрузкой
Проект Microsoft был создан для тестирования поведения автономных систем ИИ в сложных рынках — и результаты были далеко не вдохновляющими. Опенсорсная симуляция, доступная на Github, сталкивала 100 «покупательских» ботов против 300 «бизнес-ботов», имитируя реальную коммерцию.
Агенты-покупатели следовали естественным подсказкам, таким как «заказать ужин», в то время как бизнес-агенты использовали переговоры, убеждение и даже обман для заключения сделки. Каждый ИИ-агент был оснащен передовыми моделями, включая GPT-4o и GPT-5 от OpenAI, Gemini-2.5-Flash от Google, Qwen3-4b от Alibaba и опенсорсный GPTOSS-20b.
Однако, при тестировании, эти модели потерпели сокрушительное поражение. Столкнувшись с слишком большим количеством вариантов — иногда 100 или более — их «пространство внимания» рушилось. Ece Kamar из Microsoft отметила, что текущие модели действительно были захвачены множеством опций. Это привело к «предвзятости первого предложения», когда боты цеплялись за первое увиденное предложение, давая продавцам, которые реагировали быстрее, преимущество в 10-30 раз и разрушая общий показатель благополучия на рынке.
Еще более тревожной была доверчивость агентов. Некоторые «продавцы» обманывали покупателей с помощью фальшивых учетных данных и эксплуатаций путем внедрения подсказок, перенаправляя все платежи на себя. GPT-4o и GPTOSS-20b были полностью обмануты, Qwen3-4b поддался дешевому убеждению, и только Claude Sonnet 4 от Anthropic устоял под давлением. В одном из симулированных рынков все покупатели потеряли свои виртуальные средства из-за мошеннических продавцов.
Когда в процесс вмешалось сотрудничество, ситуация не улучшилась. Без человеческого руководства агенты не смогли координировать действия или эффективно распределять роли, вызывая широкомасштабное замешательство на рынке. Только когда исследователи в деталях объяснили им, что нужно делать, хаос исчез — ясный знак того, что эти модели еще не готовы к сотрудничеству сами по себе.
Microsoft сделала вывод, что, хотя ИИ-агенты имеют потенциал в качестве ассистентов, они остаются неготовыми к неконтролируемому развертыванию в реальном мире. Симуляция показала, что, оставленные без контроля, цифровые агенты могут обрушить экономику быстрее, чем построить.
Для тех, кто достаточно смел, чтобы заглянуть внутрь, Magentic Marketplace по-прежнему доступен на Github и Azure AI Foundry Labs — песочница для исследований, насколько беспорядочными могут стать автономные рынки до того, как они рухнут.
FAQ ❓
- Что такое Magentic Marketplace от Microsoft?
Симулированная цифровая экономика, созданная Microsoft Research для тестирования поведения ИИ-агентов в конкурентных и кооперативных рыночных средах. - Кто участвовал в разработке Magentic Marketplace?
Microsoft Research совместно с Университетом штата Аризона работали над созданием и изучением этого эксперимента. - Какие модели ИИ были протестированы в эксперименте?
Агенты использовали модели, такие как GPT-4o и GPT-5 от OpenAI, Gemini-2.5-Flash от Google, Qwen3-4b от Alibaba, GPTOSS-20b и Claude Sonnet 4 от Anthropic. - Где исследователи могут получить доступ к платформе Magentic Marketplace?
Опенсорсная симуляция доступна на GitHub и Azure AI Foundry Labs.













