Il benchmark di trading cripto dal vivo di Alpha Arena ha mostrato Deepseek Chat V3.1 al primo posto sabato, 18 ottobre, con la classifica del giorno che evidenziava guadagni modesti al vertice e perdite tra la maggior parte dei rivali.
6 Bot con Denaro Reale — Hyperliquid Ospita il Primo Confronto tra AI Traders

Deepseek in cima alla classifica nella battaglia cripto con denaro reale di Alpha Arena
Deepseek Chat V3.1 ha guidato il gruppo con un valore del conto Hyperliquid di $10.400—un +4,0% di ritorno—dopo tre operazioni concluse. Il bot ha pagato $58,51 in commissioni, ha registrato un tasso di vincita dello 0% sulle operazioni chiuse e ha registrato la perdita più grande di $348,33 contro una piccola “vittoria” negativa di $4,19, riflettendo che le posizioni attive e non realizzate non vengono conteggiate fino alla chiusura.
Grok-4 si è posizionato al secondo posto con $10.010 (+0,1%) e $0 di commissioni, non registrando operazioni concluse al momento dello snapshot. Claude Sonnet 4.5 si è classificato terzo a $9.985 (-0,15%) con $42,63 in commissioni e tre operazioni chiuse, mostrando la perdita più grande di $88,38. L’esperimento evidenzia quanto drammaticamente l’intelligenza artificiale (AI) sia migliorata negli ultimi anni.

GPT-5 si è piazzato quarto a $9.901 (-0,99%) dopo due operazioni chiuse e $10,10 in commissioni, con la sua perdita più grande a $59,04. Gemini 2.5 Pro si è classificato quinto a $9.725 (-2,75%), pagando le commissioni più alte del giorno ($106,46) su cinque operazioni; ha mostrato la vittoria singola più grande del giorno ($329,35) ma anche una perdita considerevole di $731,43, ottenendo un tasso di vincita del 60% sulle posizioni chiuse.
Qwen3 Max ha chiuso il campo a $9.474 (-5,26%) con $44,62 in commissioni e una sola operazione chiusa; la vittoria e la perdita più grandi del modello hanno entrambe stampato -$517,77, indicando un esito importante perdente. Complessivamente, le letture Sharpe erano basse o negative, coerenti con un numero limitato di operazioni e rumore delle prime fasi piuttosto che un rendimento corretto per il rischio stabilizzato.

Alpha Arena, lanciata il 17 ottobre dal laboratorio di ricerca Nof1, assegna a ciascun modello $10.000 per scambiare crypto perpetui autonomamente sull’exchange decentralizzato Hyperliquid (DEX). Il cruscotto pubblico di Alpha Arena traccia il valore del conto, il ritorno, il totale P&L, le commissioni, il tasso di vincita, la vittoria più grande/la perdita più grande, Sharpe e le operazioni, escludendo il P&L non realizzato fino alla chiusura delle posizioni—un avvertimento importante quando si interpretano le classifiche giornaliere.
Lo snapshot di sabato sulla classifica nof1.ai sottolinea il concetto dell’esperimento: budget identici, ragionamento LLM diverso e esecuzione trasparente. Con diversi bot che mostrano zero o poche operazioni concluse, le classifiche iniziali potrebbero cambiare man mano che le posizioni aperte si risolvono e i costi delle commissioni si accumulano. Per ora, Deepseek mantiene il vantaggio, mentre il foglio bianco di Grok-4 lo tiene vicino, e il mix di grandi vittorie e perdite di Gemini evidenzia una maggiore varianza.
FAQ
- Cos’è Alpha Arena? Un benchmark dal vivo dove sei LLM scambiano crypto perpetui autonomamente con $10.000 ciascuno.
- Quale modello era in testa il 18 ottobre? Deepseek Chat V3.1 era in testa con $10.400 (+4,0%) basato su operazioni concluse.
- Dove avvengono le operazioni? Sul exchange decentralizzato Hyperliquid con monitoraggio trasparente, on-chain.
- Le classifiche includono il P&L aperto? No, solo le operazioni chiuse contano; le posizioni attive aggiornano le classifiche una volta chiuse.













