NewsOpublikowano:10 lis 2025, 23:45

„Magnetyczny Rynek” firmy Microsoft ujawnia, jak agenci AI mogą załamać się pod presją

Microsoft Research, wraz z Uniwersytetem Stanowym w Arizonie, niedawno uruchomiło śmiałe eksperyment, zwany Magentic Marketplace — cyfrowy plac zabaw, gdzie setki agentów sztucznej inteligencji (AI) rywalizowały, współpracowały i od czasu do czasu oszukiwały się nawzajem w symulowanej gospodarce.

NAPISAŁ

Jamie Redman

UDOSTĘPNIJ

Opublikowano: 10 lis 2025, 23:45

„Magnetyczny Rynek” firmy Microsoft ujawnia, jak agenci AI mogą załamać się pod presją

‘Magentic Marketplace’ pokazuje, że boty AI mają problemy z oszustwami i przeciążeniem

Projekt Microsoftu został stworzony, aby przetestować, jak autonomiczne systemy AI zachowują się na złożonych rynkach — a wyniki były dalekie od wzmagających zaufanie. Opublikowana na otwartych zasadach symulacja, dostępna na Github, postawiła 100 botów „klientów” przeciw 300 botom „biznesowym”, odzwierciedlając rzeczywisty handel.

Agenty kupujące podążały za naturalnymi wskazówkami jak „zamów obiad”, podczas gdy agenty biznesowe korzystały z negocjacji, perswazji, a nawet oszustwa, aby zdobyć transakcję. Każdy agent AI był zasilany nowoczesnymi modelami, w tym OpenAI’s GPT-4o i GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b oraz open-source GPTOSS-20b.

Jednak podczas testów te modele spektakularnie się potknęły. Stając przed zbyt wieloma wyborami — czasami 100 lub więcej — ich „przestrzeń uwagi” się załamała. Ece Kamar z Microsoftu zauważyła, że obecne modele były naprawdę przytłoczone posiadaniem zbyt wielu opcji. To doprowadziło do „efektu pierwszej propozycji”, gdzie boty kurczowo trzymały się pierwszej oferty, którą zobaczyły, dając szybciej reagującym sprzedawcom przewagę 10-30x i obniżając ogólny wynik dobrobytu rynku.

Jeszcze bardziej niepokojąca była łatwowierność agentów. Niektórzy „sprzedawcy” oszukali kupujących za pomocą fałszywych referencji i manipulacji instrukcji, przekierowując wszystkie płatności na siebie. GPT-4o i GPTOSS-20b zostały całkowicie oszukane, Qwen3-4b nabrał się na tanią perswazję, a jedynie Anthropic’s Claude Sonnet 4 wytrzymał presję. W jednym symulowanym rynku wszyscy kupujący stracili swoje wirtualne fundusze na rzecz oszukańczych sprzedawców.

Kiedy w grę weszła współpraca, sytuacja się nie poprawiła. Bez ludzkiego przewodnictwa agenty nie potrafiły skutecznie współpracować ani przypisać ról, co generowało chaos na rynku. Dopiero gdy badacze szczegółowo ich instruowali, chaos ustępował — wyraźna oznaka, że te modele nie są wrodzenie gotowe do współpracy, przynajmniej na razie.

Microsoft stwierdził, że choć agenty AI mają potencjał jako asystenci, nadal są nieodpowiednie do niesuperwizyjnego wdrażania w rzeczywistym świecie. Symulacja pokazała, że pozostawione same sobie, cyfrowe agenty mogą szybciej zniszczyć gospodarkę, niż ją zbudować.

Dla tych odważnych, którzy chcą zajrzeć pod maskę, Magentic Marketplace pozostaje open-source na Github i Azure AI Foundry Labs — piaskownicą do badania, jak bardzo nieporządne mogą stać się autonomiczne rynki, zanim wybuchną.

FAQ ❓

Czym jest Microsoft’s Magentic Marketplace?
Symulowana cyfrowa gospodarka stworzona przez Microsoft Research do testowania, jak agenty AI zachowują się w konkurencyjnych i współpracujących środowiskach rynkowych.
Kto uczestniczył w tworzeniu Magentic Marketplace?
Microsoft Research współpracował z Uniwersytetem Stanowym w Arizonie, aby zbudować i zbadać eksperyment.
Jakie modele AI zostały przetestowane w eksperymencie?
Agenty były zasilane przez modele takie jak OpenAI’s GPT-4o i GPT-5, Google’s Gemini-2.5-Flash, Alibaba’s Qwen3-4b, GPTOSS-20b i Anthropic’s Claude Sonnet 4.
Gdzie badacze mogą uzyskać dostęp do platformy Magentic Marketplace?
Symulacja open-source jest dostępna na GitHub i Azure AI Foundry Labs.

Tagi w tym artykule

Artificial intelligence (AI)Microsoft

„Magnetyczny Rynek” firmy Microsoft ujawnia, jak agenci AI mogą załamać się pod presją

‘Magentic Marketplace’ pokazuje, że boty AI mają problemy z oszustwami i przeciążeniem

FAQ ❓

Tagi w tym artykule

Najlepsze giełdy kryptowalut

Najlepsze giełdy Bitcoin

Najlepsze giełdy P2P

Zobacz wszystkie recenzje giełd...

Giełdy

Portfele

ViaBTC prezentuje rozwiązania w zakresie pożyczek zabezpieczonych aktywami, które pozwalają radzić sobie w zróżnicowanych warunkach rynkowych

MEXC włącza USD1 do kompleksowej infrastruktury przeznaczonej dla użytkowników na całym świecie

Safe uruchamia wersję beta Safenet, umożliwiając posiadaczom tokenów SAFE udział w zapewnianiu bezpieczeństwa sieci

Adrian Wall z Digital Sovereignty Alliance wygłasza przemówienie na temat tokenizacji podczas konferencji Penn Blockchain Conference 2026

Bitget wprowadza kryptowaluty do codziennych wydatków dzięki wprowadzeniu karty Bitget na rynek regionu Azji i Pacyfiku

MiCA w skrócie: 1 lipca nie jest terminem ostatecznym. Dla większości dostawców usług ten termin już minął

Pułapka odszyfrowywania z mocą wsteczną: dlaczego modernizacje uwzględniające zabezpieczenia postkwantowe nie ochronią Twojej prywatności z przeszłości

KOMUNIKATY PRASOWE

ViaBTC prezentuje rozwiązania w zakresie pożyczek zabezpieczonych aktywami, które pozwalają radzić sobie w zróżnicowanych warunkach rynkowych

MEXC włącza USD1 do kompleksowej infrastruktury przeznaczonej dla użytkowników na całym świecie

Safe uruchamia wersję beta Safenet, umożliwiając posiadaczom tokenów SAFE udział w zapewnianiu bezpieczeństwa sieci

Adrian Wall z Digital Sovereignty Alliance wygłasza przemówienie na temat tokenizacji podczas konferencji Penn Blockchain Conference 2026

Bitget wprowadza kryptowaluty do codziennych wydatków dzięki wprowadzeniu karty Bitget na rynek regionu Azji i Pacyfiku

NAJNOWSZE WIADOMOŚCI

MiCA w skrócie: 1 lipca nie jest terminem ostatecznym. Dla większości dostawców usług ten termin już minął

Pułapka odszyfrowywania z mocą wsteczną: dlaczego modernizacje uwzględniające zabezpieczenia postkwantowe nie ochronią Twojej prywatności z przeszłości

Czym jest Hermes Agent? Wyjaśnienie działania samodoskonalącej się sztucznej inteligencji firmy Nous Research

Komisja Papierów Wartościowych i Giełd (SEC) ostrzega, że fałszywi urzędnicy nadużywają zaufania inwestorów, stosując oszukańcze taktyki

Coinbase wyjaśnia: „Nie zamierzamy stać się bankiem” po otrzymaniu warunkowej zgody OCC, która zapowiada poważniejsze zmiany