알파 아레나, 10월 18일에 시작된 실험으로 여섯 개의 AI 챗봇이 암호화폐 거래를 진행하며 아시아 모델들이 서구 모델들보다 뛰어난 성과를 보여주고 있습니다. 현재 Qwen과 Deepseek가 경쟁에서 선두를 달리고 있으며, GPT-5가 지금까지 가장 부진한 성적을 기록했습니다.
Alpha Arena AI 무역 실험, 현재까지 서양 모델을 능가하는 중국 성과

알파 아레나 경쟁, 거래에서 아시아 AI 모델의 우수성 시연
사실:
알파 아레나는 다양한 인공지능(AI) 모델들이 Hyperliquid에서 영구 선물을 거래하는 경쟁으로, 이 모델들이 거래 움직임을 위해 자체적으로 알파를 생성하는 방식에 대한 흥미로운 통찰력을 제공합니다.
금융 AI 연구소 Nof1이 주최한 이번 경쟁은 Claude 4.5 Sonnet, Deepseek V3.1 Chat, Gemini 2.5 Pro, GPT-5, Grok 4, Qwen 3 Max라는 여섯 개의 서로 다른 모델들이 $10,000의 시작 예산으로 최고의 결과를 얻기 위해 전면적인 거래 전투에 뛰어들었습니다.
8일간의 거래 후 현재 순위에서 Qwen이 $17,496.35의 계좌 잔액과 BTC에 대한 활발한 포지션 하나로 선두를 달리고 있으며, 그 뒤를 Deepseek가 잇고 있습니다.
반대로, 다른 모든 모델들은 돈을 잃었으며, GPT-5가 현재까지 가장 부진한 거래 성과를 기록했습니다. OpenAI에서 육성된 이 모델은 $7,000 이상을 잃고 리더보드 최하위로 떨어졌습니다.
분석가들은 지금까지 우수한 성과를 보인 중국에서 개발된 모델들과 전부 돈을 잃은 서구 모델들 간의 차이에 주목하고 있습니다.
중요성:
알파 아레나는 실제 화폐를 포함한 결정을 내리고 거래 포트폴리오를 관리하는 모델들의 역량을 측정하려고 합니다. AI 거래는 어떤 이들에게는 거래의 미래로 언급되며, AI는 자체 알파를 생성하기 위해 많은 양의 데이터를 처리할 수 있습니다.
그럼에도 불구하고, 이 실험은 AI 자동 거래가 아직 진행 중임을 보여주고 있으며, 현재까지 아시아 모델들이 앞서고 있습니다.
Nof1의 창립자 Jay Azhang은 이번 시즌의 목표가 각 모델의 편향성, 거래 스타일의 주요 차이점, 그리고 기본적인 리스크 관리 규칙을 따를 수 있는지를 파악하는 것이라고 언급했습니다.
앞으로의 전망:
Nof1는 이미 이러한 모델들의 거래 능력을 테스트할 두 번째 시즌을 예고했으며, 이번에는 사람 거래자도 새로운 단계에 포함될 예정입니다.
“전반적으로 LLM과 거래의 잠재력에 대해 기대하고 있지만 여전히 회의적입니다. 테스트하고 배울 것이 많습니다,”라고 Azhang은 결론지었습니다.
FAQ
-
알파 아레나란 무엇인가요?
알파 아레나는 다양한 AI 모델들이 Hyperliquid에서 영구 선물을 거래하며 그들의 거래 전략과 성과를 조사하는 경쟁입니다. -
어떤 AI 모델들이 경쟁 중인가요?
경쟁에는 Claude 4.5 Sonnet, Deepseek V3.1 Chat, Gemini 2.5 Pro, GPT-5, Grok 4, Qwen 3 Max와 같은 AI 모델들이 포함됩니다. -
누가 경쟁을 선도하고 있나요?
현재 Qwen이 $17,496.35의 잔액으로 선두에 있으며, GPT-5는 $7,000 이상을 잃어 성과 부진을 겪고 있습니다. -
이 경쟁의 의미는 무엇인가요?
알파 아레나는 AI 거래의 효율성을 탐구하여 중국과 서구 모델의 중요한 성능 차이점을 드러내고, 지속적인 과제를 강조하고자 합니다.









