Microsoft Research, junto con la Universidad Estatal de Arizona, lanzó recientemente un experimento audaz llamado Magentic Marketplace: un parque de juegos digital donde cientos de agentes de inteligencia artificial (IA) compitieron, colaboraron y, ocasionalmente, se engañaron entre sí en una economía simulada.
El 'Mercado Magnético' de Microsoft revela cómo los agentes de IA pueden colapsar bajo presión

El ‘Magentic Marketplace’ muestra que los bots de IA luchan con el engaño y la sobrecarga
El proyecto de Microsoft fue construido para probar cómo se comportan los sistemas de IA autónomos en mercados complejos, y los resultados estuvieron lejos de inspirar confianza. La simulación de código abierto, disponible en Github, enfrentó a 100 bots “cliente” contra 300 bots “negocio”, reflejando el comercio del mundo real.
Los agentes compradores siguieron indicaciones naturales como “pedir cena”, mientras que los agentes de negocios utilizaron negociación, persuasión e incluso engaño para cerrar el trato. Cada agente IA estaba impulsado por modelos de última generación que incluyen GPT-4o y GPT-5 de OpenAI, Gemini-2.5-Flash de Google, Qwen3-4b de Alibaba y el de código abierto GPTOSS-20b.
Sin embargo, cuando se probaron, estos modelos tropezaron espectacularmente. Ante demasiadas opciones, a veces 100 o más, su “espacio de atención” colapsó. Ece Kamar de Microsoft señaló que los modelos actuales se abrumaron realmente al tener demasiadas opciones. Esto llevó a un “sesgo de primera propuesta”, donde los bots se aferraron a la primera oferta que vieron, otorgando a los vendedores que respondían más rápido una ventaja de 10-30x y hundiendo el puntaje de bienestar general del mercado.
Aún más preocupante fue la credulidad de los agentes. Algunos “vendedores” estafaron a los compradores a través de credenciales falsas y exploits de inyección de indicaciones, redirigiendo todos los pagos hacia ellos mismos. GPT-4o y GPTOSS-20b fueron completamente engañados, Qwen3-4b cayó ante la persuasión barata y solo Claude Sonnet 4 de Anthropic resistió la presión. En un mercado simulado, todos los compradores perdieron sus fondos virtuales ante vendedores fraudulentos.
Cuando la colaboración entró en la mezcla, las cosas no mejoraron. Sin la guía humana, los agentes no pudieron coordinarse o asignar roles de manera efectiva, generando confusión a nivel del mercado. Solo cuando los investigadores les dieron instrucciones detalladas de manera explícita, el caos se calmó, una clara señal de que estos modelos aún no están inherentemente listos para colaborar.
Microsoft concluyó que si bien los agentes de IA tienen potencial como asistentes, permanecen mal equipados para el despliegue autónomo en el mundo real. La simulación mostró que, dejados a su suerte, los agentes digitales podrían colapsar una economía más rápido de lo que podrían construir una.
Para aquellos lo suficientemente valientes como para mirar bajo el capó, Magentic Marketplace sigue siendo de código abierto en Github y Azure AI Foundry Labs: un espacio de pruebas para explorar cuán desordenados pueden volverse los mercados autónomos antes de implosionar.
FAQ ❓
- ¿Qué es el Magentic Marketplace de Microsoft?
Una economía digital simulada construida por Microsoft Research para probar cómo se comportan los agentes de IA en entornos de mercado competitivos y cooperativos. - ¿Quién participó en el desarrollo del Magentic Marketplace?
Microsoft Research colaboró con la Universidad Estatal de Arizona para construir y estudiar el experimento. - ¿Qué modelos de IA se probaron en el experimento?
Los agentes fueron impulsados por modelos como GPT-4o y GPT-5 de OpenAI, Gemini-2.5-Flash de Google, Qwen3-4b de Alibaba, GPTOSS-20b y Claude Sonnet 4 de Anthropic. - ¿Dónde pueden los investigadores acceder a la plataforma Magentic Marketplace?
La simulación de código abierto está disponible en GitHub y Azure AI Foundry Labs.
Etiquetas en esta historia
Selecciones de Juegos de Bitcoin
425% hasta 5 BTC + 100 Giros Gratis














