前段时间,有个 AI 事件大家应该都有所耳闻:AI 币圈比赛,Qwen3 Max、DeepSeek Chat V3.1 参赛,并拿下来冠亚军。
虽然不懂币圈的事儿,但作为 AI 应用的大事件,还是需要跟踪了解下的,也一同分享给大家。
阿尔法竞技场
阿尔法竞技场(Alpha Arena)是 nof1.ai 举办的一场 AI 投资竞赛。
参赛选手是 6 款大模型,分别是 DeepSeek Chat V3.1、Qwen3 Max、Grok 4、Gemini 2.5 Pro、GPT-5、Claude Sonnet 4.5。
比赛中,每款大模型获得 1 万美元初始资金,在 Hyperliquid 上使用真实资金交易加密货币永续币,比赛于 2025 年 10 月 17 日正式启动,11 月 3 日结束。
最终 Qwen3 Max 和 DeepSeek Chat V3.1 分别以 22.3% 和 4.89% 的收益率夺得冠亚军,其余四款美国大模型均大幅亏损。

如果想要实际观看下事后现场的话,可以访问原网址:nof1.ai/。
各模型表现
因为不太懂币圈的规则,因此,我让没有参与比赛的第三方 AI 豆包帮我总结了各模型的比赛表现。
- Qwen3 Max:进攻型,重仓 BTC+5 倍杠杆,策略简单高效,高风险高回报,波动市场适应性强
- DeepSeek Chat V3.1:理性系统派,低频长持,风控出色(Sharpe 值最高),上涨市场准确率高,熊市易回撤
- Claude Sonnet 4.5:谨慎保守,低频率全长仓,牛市稳健,熊市缺乏对冲,风险控制不足。
- Grok 4:操作保守,频率适中,中等看多,难抓大趋势,熊市乐观偏见导致大亏
- Gemini 2.5 Pro:高频交易,长短仓平衡,胜率低,过度操作累积亏损,侧向市场表现差。
- GPT-5:高频随机决策,持仓分散但风控薄弱,波动大亏损严重,表现最差。
虽然,这次比赛由于时间较短、资金较少,可能无法完整体现出模型的能力,但这么长时间的公开模型对比还是比较少见的,完全可以作为后续日常使用选择模型的一个参考。
比如,谨慎保守的 Claude 确实适合编程,再比如,高风险高回报的 Qwen3 Max 可以作为灵活写作主力使用。
炒币 to 炒股
如果说上面的币圈比赛还离我们比较远的话,那今天看到的另一条资讯可能更加贴近了。
10月24日,AI 投资公司 RockFlow 推出 RockAlpha(AI炒股大赛)。
最初只有一个"经典赛场",参赛选手依然为 DeepSeek、Claude、ChatGPT、Qwen、Grok 和 Gemini。
后来加入了"迷因股(网红股)"、"AI股"专场,参赛选手也增加了豆包、Minimax、Kimi、文心。
截止到发文,战况如下。
- 经典赛场:Claude 4.5 以 5.56% 位居第一,DeepSeek 紧随其后。

- 迷因股(网红股):豆包第一,Qwen Max紧随其后,但是差距都比较小。

- AI股:豆包 6.31% 领先,新秀 MiniMax M2 微距第二。

大家如果感兴趣,也可以过去围观。

结语
说实话,知道这个事情的时候,我是比较吃惊的。
周边的很多人还在讨论 AI 有没有用,好不好用呢,结果,国外的 AI 都已经可以落地操盘了。
感觉自己的 AI 实践与落地工作还有待提高啊。