Alpha Arena 的加密货币交易实时基准数据显示,10 月 18 日星期六,Deepseek Chat V3.1 位居榜首,当天的排名显示榜首有所增长,而大多数对手则下滑。
6个机器人与真实货币——Hyperliquid 主办首届AI交易对决

Deepseek 在 Alpha Arena 的真实货币加密战中位居榜首
Deepseek Chat V3.1 以Hyperliquid 账户价值 $10,400 领先,完成三笔交易后获得 +4.0% 的回报。该机器人支付了 $58.51 的费用,在已完成交易中赢率为 0%,记录了最大的损失 $348.33,相比之下小的负“胜利”为 $4.19,反映出活跃的未实现头寸在平仓前不计入。
Grok-4 以 $10,010 (+0.1%) 和 $0 的费用位居第二,截至快照,没有完成交易。Claude Sonnet 4.5 以 $9,985 (-0.15%) 排名第三,费用为 $42.63,完成了三笔交易,最大损失为 $88.38。该实验突显了人工智能 (AI) 近年来的显著进步。

GPT-5 以 $9,901 (-0.99%) 排名第四,完成两笔交易后支付了 $10.10 的费用,最大损失为 $59.04。Gemini 2.5 Pro 排名第五,价值 $9,725 (-2.75%),在五笔交易中支付了当天最高的费用 ($106.46);它显示当天的最大单次盈利 ($329.35) 但也有显著的 $731.43 损失,闭合头寸的胜率为 60%。
Qwen3 Max 以 $9,474 (-5.26%) 排名最后,费用 $44.62,并且只完成了一笔交易;该模型的一次显著之输损记录为 -$517.77。整体而言,夏普比率读数低或为负,符合有限的交易次数和初期干扰噪声,而不是经过调整后的风险表现。

Alpha Arena 于 10 月 17 日由研究实验室 Nof1 推出,为每个模型分配 $10,000 在 Hyperliquid 去中心化交易所 (DEX) 上自动交易加密永久合约。Alpha Arena 公共仪表板跟踪账户价值、回报、总损益、费用、胜率、最大盈利/损失、夏普比率和交易数,同时排除未实现的损益,直到头寸平仓时才考虑——这是解读每日排名时的重要注意事项。
Nof1.ai 排行榜上的星期六快照表明该实验的前提:相同的预算,不同的 LLM 推理,透明的执行。随着几只机器人显示出没有或很少的已完成交易,初期排名可能会随着开放头寸的解决和费用负担的增加而发生变化。当前,Deepseek 有优势,而 Grok-4 的空白板块让它紧随其后,而 Gemini 的大额盈利和损失体现了更高的波动性。
常见问题
- 什么是 Alpha Arena? 一个实时基准,六个 LLM 各自以 $10,000 进行加密永久合约自动交易。
- 10 月 18 日哪个模型领先? 基于已完成的交易,Deepseek Chat V3.1 以 $10,400 (+4.0%) 领先。
- 交易在哪里进行? 在拥有透明链上跟踪的 Hyperliquid 去中心化交易所进行。
- 排名是否包括未实现损益? 不,仅计算已完成交易;活跃头寸平仓后更新排名。














