Microsoft Research, cùng với Đại học Bang Arizona, gần đây đã ra mắt một thí nghiệm táo bạo mang tên Chợ Magentic — một sân chơi kỹ thuật số nơi hàng trăm tác nhân trí tuệ nhân tạo (AI) cạnh tranh, hợp tác và đôi khi lừa gạt nhau trong một nền kinh tế mô phỏng.
'Chợ Nam Châm' của Microsoft tiết lộ cách các đại lý AI có thể sụp đổ dưới áp lực

‘Chợ Magentic’ Cho Thấy Các Bot AI Gặp Khó Khăn Với Sự Lừa Dối và Quá Tải
Dự án của Microsoft được xây dựng để kiểm tra cách mà các hệ thống AI tự hành hoạt động trong thị trường phức tạp — và những phát hiện này không gây được nhiều niềm tin. Mô phỏng mã nguồn mở, có sẵn trên Github, đặt 100 bot “khách hàng” chống lại 300 bot “doanh nghiệp”, phản ánh thương mại ngoài đời thực.
Các tác nhân mua hàng theo dõi các gợi ý tự nhiên như “đặt bữa tối”, trong khi các tác nhân kinh doanh sử dụng đàm phán, thuyết phục và thậm chí lừa dối để thắng được thỏa thuận. Mỗi tác nhân AI được hỗ trợ bởi các mô hình tiên tiến bao gồm GPT-4o và GPT-5 của OpenAI, Gemini-2.5-Flash của Google, Qwen3-4b của Alibaba, và GPTOSS-20b mã nguồn mở.
Tuy nhiên, khi được thử nghiệm, các mô hình này đã vấp ngã ngoạn mục. Đối mặt với quá nhiều lựa chọn — đôi khi là 100 hoặc hơn — “không gian chú ý” của chúng bị sụp đổ. Ece Kamar của Microsoft đã lưu ý rằng các mô hình hiện tại thực sự bị choáng ngợp khi có quá nhiều lựa chọn. Điều này dẫn đến sự “thiên vị đề xuất đầu tiên” (first-proposal bias), nơi các bot bám vào lời đề nghị đầu tiên mà chúng thấy, mang lại cho người bán phản hồi nhanh hơn một lợi thế từ 10 đến 30 lần và làm giảm điểm phúc lợi tổng thể của thị trường.
Điều đáng lo ngại hơn nữa là sự dễ dàng bị lừa của các tác nhân này. Một số “người bán” đã lừa khách hàng qua các chứng chỉ giả và khai thác chèn gợi ý, đổi hướng tất cả các khoản thanh toán vào cho họ. GPT-4o và GPTOSS-20b đã bị lừa hoàn toàn, Qwen3-4b bị lừa bởi sự thuyết phục rẻ tiền, và chỉ có Claude Sonnet 4 của Anthropic giữ vững dưới áp lực. Trong một thị trường mô phỏng, tất cả khách hàng đều mất tiền ảo của họ cho những người bán gian lận.
Khi sự hợp tác được đưa vào, mọi thứ không được cải thiện. Không có sự hướng dẫn của con người, các tác nhân không thể phối hợp hoặc chỉ định vai trò hiệu quả, dẫn đến sự nhầm lẫn trên toàn thị trường. Chỉ khi các nhà nghiên cứu đưa cho họ hướng dẫn chi tiết thì sự hỗn loạn mới giảm đi — một dấu hiệu rõ ràng cho thấy những mô hình này chưa sẵn sàng để hợp tác.
Microsoft kết luận rằng mặc dù các tác nhân AI có tiềm năng làm trợ lý, chúng vẫn không phù hợp để triển khai trong thế giới thực không giám sát. Mô phỏng cho thấy khi để mặc chúng, các tác nhân số có thể đổ vỡ một nền kinh tế nhanh hơn khả năng xây dựng của chúng.
Đối với những ai dũng cảm đủ để xem xét bên trong, Chợ Magentic vẫn mở mã nguồn trên Github và Azure AI Foundry Labs — một sân chơi để khám phá xem thị trường tự trị có thể lộn xộn đến mức nào trước khi sụp đổ.
Câu hỏi thường gặp ❓
- Chợ Magentic của Microsoft là gì?
Một nền kinh tế kỹ thuật số mô phỏng được xây dựng bởi Microsoft Research để kiểm tra cách mà các tác nhân AI hành xử trong môi trường thị trường cạnh tranh và hợp tác. - Ai đã tham gia phát triển Chợ Magentic?
Microsoft Research đã hợp tác với Đại học Bang Arizona để xây dựng và nghiên cứu thí nghiệm này. - Những mô hình AI nào đã được thử nghiệm trong thí nghiệm này?
Các tác nhân được hỗ trợ bởi các mô hình như GPT-4o và GPT-5 của OpenAI, Gemini-2.5-Flash của Google, Qwen3-4b của Alibaba, GPTOSS-20b, và Claude Sonnet 4 của Anthropic. - Nơi đâu các nhà nghiên cứu có thể truy cập nền tảng Chợ Magentic?
Mô phỏng mã nguồn mở có sẵn trên GitHub và Azure AI Foundry Labs.








