Microsoft Research, insieme all’Arizona State University, ha recentemente lanciato un audace esperimento chiamato Magentic Marketplace – un parco giochi digitale dove centinaia di agenti di intelligenza artificiale (AI) hanno gareggiato, collaborato e talvolta ingannato l’un l’altro in un’economia simulata.
Il 'Magentic Marketplace' di Microsoft Rivela Come gli Agenti AI Possano Collassare Sotto Pressione

Il ‘Magentic Marketplace’ Mostra le Difficoltà dei Bot AI con l’Inganno e il Sovraccarico
Il progetto Microsoft è stato costruito per testare come i sistemi autonomi di AI si comportano nei mercati complessi — e i risultati non sono stati affatto rassicuranti. La simulazione open-source, disponibile su Github, ha messo a confronto 100 bot “cliente” contro 300 bot “business”, rispecchiando il commercio del mondo reale.
Gli agenti acquirenti hanno seguito istruzioni naturali come “ordina la cena”, mentre gli agenti aziendali hanno utilizzato negoziazione, persuasione e persino inganno per vincere l’affare. Ogni agente AI era alimentato da modelli all’avanguardia tra cui i GPT-4o e GPT-5 di OpenAI, Gemini-2.5-Flash di Google, Qwen3-4b di Alibaba e il GPTOSS-20b open-source.
Eppure, quando testati, questi modelli sono inciampati spettacolarmente. Di fronte a troppe scelte — a volte 100 o più — il loro “spazio di attenzione” è collassato. Ece Kamar di Microsoft ha osservato che i modelli attuali si sono davvero sopraffatti avendo troppe opzioni. Questo ha portato a un “bias della prima proposta”, dove i bot si sono aggrappati alla prima offerta che hanno visto, concedendo ai venditori più veloci un vantaggio di 10-30x e deteriorando il punteggio complessivo del benessere del marketplace.
Ancora più preoccupante è stata la credulità degli agenti. Alcuni “venditori” hanno truffato gli acquirenti tramite credenziali false ed exploit di iniezione di istruzioni, reindirizzando tutti i pagamenti a sé stessi. GPT-4o e GPTOSS-20b sono stati completamente ingannati, Qwen3-4b è caduto per la persuasione economica, e solo il Claude Sonnet 4 di Anthropic ha resistito sotto pressione. In un mercato simulato, tutti gli acquirenti hanno perso i loro fondi virtuali per venditori fraudolenti.
Quando è entrata in gioco la collaborazione, le cose non sono migliorate. Senza guida umana, gli agenti non sono riusciti a coordinare o assegnare ruoli in modo efficace, generando confusione a livello di mercato. Solo quando i ricercatori hanno dato loro istruzioni dettagliate il caos si è placato — un chiaro segno che questi modelli non sono intrinsecamente pronti per collaborare, almeno non ancora.
Microsoft ha concluso che mentre gli agenti AI hanno potenziale come assistenti, rimangono inadatti per un dispiegamento reale non supervisionato. La simulazione ha mostrato che lasciati a sé stessi, gli agenti digitali potrebbero far crollare un’economia più velocemente di quanto potrebbero costruirne una.
Per chi ha il coraggio di sbirciare sotto il cofano, il Magentic Marketplace rimane open-source su Github e Azure AI Foundry Labs — un sandbox per esplorare quanto possano diventare caotici i mercati autonomi prima di implodere.
FAQ ❓
- Cos’è il Magentic Marketplace di Microsoft?
Un’economia digitale simulata costruita da Microsoft Research per testare come si comportano gli agenti AI in ambienti di mercato competitivi e cooperativi. - Chi ha partecipato allo sviluppo del Magentic Marketplace?
Microsoft Research ha collaborato con l’Arizona State University per costruire e studiare l’esperimento. - Quali modelli di AI sono stati testati nell’esperimento?
Gli agenti erano alimentati da modelli come i GPT-4o e GPT-5 di OpenAI, Gemini-2.5-Flash di Google, Qwen3-4b di Alibaba, GPTOSS-20b e Claude Sonnet 4 di Anthropic. - Dove possono i ricercatori accedere alla piattaforma Magentic Marketplace?
La simulazione open-source è disponibile su GitHub e Azure AI Foundry Labs.













