Sağlayan
News

Microsoft’un 'Manyetik Pazar Yeri', AI Ajanlarının Baskı Altında Nasıl Çöktüğünü Gösteriyor

Microsoft Araştırma, Arizona Eyalet Üniversitesi ile birlikte, yapay zeka (YZ) ajanlarının bir simüle edilmiş ekonomi içinde rekabet ettiği, iş birliği yaptığı ve zaman zaman birbirlerini kandırdığı dijital bir oyun alanı olan Magentic Marketplace adında cesur bir deneyi başlattı.

PAYLAŞ
Microsoft’un 'Manyetik Pazar Yeri', AI Ajanlarının Baskı Altında Nasıl Çöktüğünü Gösteriyor

‘Magentic Marketplace’ AI Botlarının Aldatmayla ve Aşırı Yüklemeyle Mücadele Ettiğini Gösteriyor

Microsoft projesi, özerk YZ sistemlerinin karmaşık pazarlarda nasıl davrandığını test etmek için kuruldu ve bulgular güven verici olmaktan uzaktı. Kaynak kodu açık simülasyon, Github‘da mevcuttur ve gerçek dünyadaki ticareti yansıtan 100 “müşteri” botunu 300 “iş” botuna karşı karşıya getirdi.

Alıcı ajanlar, “akşam yemeği siparişi ver” gibi doğal komutları takip ederken, iş ajansları müzakere, ikna ve hatta aldatmayı kullanarak anlaşmayı kazanmaya çalıştı. Her bir YZ ajansı, OpenAI’nin GPT-4o ve GPT-5, Google’ın Gemini-2.5-Flash, Alibaba’nın Qwen3-4b ve kaynak kodu açık GPTOSS-20b gibi en son modellerle güçlendirilmişti.

Ancak test edildiğinde, bu modeller spektaküler bir şekilde tökezledi. Çok fazla seçeneğe — bazen 100 veya daha fazla — karşı karşıya kaldıklarında “dikkat alanları” çöktü. Microsoft’tan Ece Kamar, mevcut modellerin çok fazla seçeneğin olması nedeniyle gerçekten bunaldığını belirtti. Bu, botların gördükleri ilk teklife sarıldığı “ilk teklif yanlılığına” yol açtı, bu da daha hızlı yanıt veren satıcılara 10-30 kat avantaj sağladı ve piyasanın genel refah puanını düşürdü.

Daha da endişe verici olan, ajanların aldatılabilirliğiydi. Bazı “satıcılar”, sahte kimlik bilgileri ve komut enjeksiyonu açıkları aracılığıyla alıcıları dolandırarak tüm ödemeleri kendi hesaplarına yönlendirdi. GPT-4o ve GPTOSS-20b tamamen kandırıldı, Qwen3-4b ucuz ikna numaralarına kandı ve sadece Anthropic’in Claude Sonnet 4 zorluklara karşı dayanıklı kaldı. Bir simüle edilmiş pazarda, tüm alıcılar sahte satıcılara sanal fonlarını kaybetti.

Birlikte çalışmaya girildiğinde, durum daha iyiye gitmedi. İnsan rehberliği olmadan, ajanlar etkili bir şekilde koordine olamadı veya görevleri atayamadı ve bu da pazar çapında karmaşaya yol açtı. Ancak araştırmacılar onlara detaylı talimatları adım adım verdiğinde kaos azaldı — bu, bu modellerin henüz doğal olarak hazır olmadıklarının açık bir işaretiydi.

Microsoft, YZ ajanlarının asistanlar olarak potansiyele sahip olduklarını, ancak gözetimsiz gerçek dünya uygulamaları için uygun olmadıklarını sonucuna vardı. Simülasyon, kendi cihazlarına bırakıldıklarında, dijital ajanların bir ekonomiyi inşa etmekten daha hızlı çökertebileceğini gösterdi.

Kaputun altına bakacak kadar cesur olanlar için, Magentic Marketplace Github ve Azure AI Foundry Labs üzerinde açık kaynak olarak kalmaya devam etmekte — otonom pazarların karmaşıklaşmadan önce ne kadar karışabileceğini keşfetmek için bir alan sağlamaktadır.

SSS ❓

  • Microsoft’un Magentic Marketplace’i nedir?
    YZ ajanlarının rekabetçi ve işbirlikçi pazar ortamlarında nasıl davrandığını test etmek için Microsoft Araştırma tarafından oluşturulan simüle edilmiş dijital bir ekonomi.
  • Magentic Marketplace’i geliştirmekte kimler yer aldı?
    Microsoft Araştırma, deneyi inşa etmek ve incelemek için Arizona Eyalet Üniversitesi ile iş birliği yaptı.
  • Deneyde hangi YZ modelleri test edildi?
    Ajanlar, OpenAI’nin GPT-4o ve GPT-5, Google’ın Gemini-2.5-Flash, Alibaba’nın Qwen3-4b, GPTOSS-20b ve Anthropic’in Claude Sonnet 4 gibi modellerle güçlendirildi.
  • Araştırmacılar Magentic Marketplace platformuna nereden erişebilirler?
    Kaynak kodu açık simülasyon, GitHub ve Azure AI Foundry Labs üzerinde mevcut.