当你还在用 AI 写周报,别人的 AI 已经在炒币炒股了

前段时间,有个 AI 事件大家应该都有所耳闻:AI 币圈比赛,Qwen3 MaxDeepSeek Chat V3.1 参赛,并拿下来冠亚军。

虽然不懂币圈的事儿,但作为 AI 应用的大事件,还是需要跟踪了解下的,也一同分享给大家。

阿尔法竞技场

阿尔法竞技场(Alpha Arena)是 nof1.ai 举办的一场 AI 投资竞赛。

参赛选手是 6 款大模型,分别是 DeepSeek Chat V3.1Qwen3 MaxGrok 4Gemini 2.5 ProGPT-5Claude Sonnet 4.5

比赛中,每款大模型获得 1 万美元初始资金,在 Hyperliquid 上使用真实资金交易加密货币永续币,比赛于 2025 年 10 月 17 日正式启动,11 月 3 日结束。

最终 Qwen3 MaxDeepSeek Chat V3.1 分别以 22.3%4.89% 的收益率夺得冠亚军,其余四款美国大模型均大幅亏损。

如果想要实际观看下事后现场的话,可以访问原网址:nof1.ai/。

各模型表现

因为不太懂币圈的规则,因此,我让没有参与比赛的第三方 AI 豆包帮我总结了各模型的比赛表现。

  • Qwen3 Max:进攻型,重仓 BTC+5 倍杠杆,策略简单高效,高风险高回报,波动市场适应性强
  • DeepSeek Chat V3.1:理性系统派,低频长持,风控出色(Sharpe 值最高),上涨市场准确率高,熊市易回撤
  • Claude Sonnet 4.5:谨慎保守,低频率全长仓,牛市稳健,熊市缺乏对冲,风险控制不足。
  • Grok 4:操作保守,频率适中,中等看多,难抓大趋势,熊市乐观偏见导致大亏
  • Gemini 2.5 Pro:高频交易,长短仓平衡,胜率低,过度操作累积亏损,侧向市场表现差。
  • GPT-5:高频随机决策,持仓分散但风控薄弱,波动大亏损严重,表现最差。

虽然,这次比赛由于时间较短、资金较少,可能无法完整体现出模型的能力,但这么长时间的公开模型对比还是比较少见的,完全可以作为后续日常使用选择模型的一个参考

比如,谨慎保守的 Claude 确实适合编程,再比如,高风险高回报的 Qwen3 Max 可以作为灵活写作主力使用。

炒币 to 炒股

如果说上面的币圈比赛还离我们比较远的话,那今天看到的另一条资讯可能更加贴近了。

10月24日,AI 投资公司 RockFlow 推出 RockAlpha(AI炒股大赛)

最初只有一个"经典赛场",参赛选手依然为 DeepSeekClaudeChatGPTQwenGrokGemini

后来加入了"迷因股(网红股)"、"AI股"专场,参赛选手也增加了豆包MinimaxKimi文心

截止到发文,战况如下。

  • 经典赛场:Claude 4.5 以 5.56% 位居第一,DeepSeek 紧随其后。
  • 迷因股(网红股):豆包第一,Qwen Max紧随其后,但是差距都比较小。
  • AI股:豆包 6.31% 领先,新秀 MiniMax M2 微距第二。

大家如果感兴趣,也可以过去围观。

实况地址:rockalpha.rockflow.ai/

结语

说实话,知道这个事情的时候,我是比较吃惊的。

周边的很多人还在讨论 AI 有没有用,好不好用呢,结果,国外的 AI 都已经可以落地操盘了。

感觉自己的 AI 实践与落地工作还有待提高啊。

相关推荐
Juchecar2 小时前
翻译:软件开发的演进:从机器码到 AI 编排
人工智能
字节数据平台2 小时前
火山引擎发布Data Agent新能力,推动用户洞察进入“智能3.0时代”
大数据·人工智能
盈电智控2 小时前
体力劳动反而更难被AI取代?物联网科技如何守护最后的劳动阵地
开发语言·人工智能·python
也许是_2 小时前
大模型原理之深度学习与神经网络入门
人工智能·深度学习·神经网络
数智顾问2 小时前
(111页PPT)大型集团IT治理体系规划详细解决方案(附下载方式)
大数据·人工智能
海棠AI实验室2 小时前
AI代发货(DropShopping)革命:构建自动化电商帝国终极指南
运维·人工智能·自动化
谢景行^顾3 小时前
深度学习--激活函数
人工智能·python·机器学习
三千院本院3 小时前
LlaMA_Factory实战微调Qwen-LLM大模型
人工智能·python·深度学习·llama
ifeng09183 小时前
HarmonyOS实战项目:AI健康助手(影像识别与健康分析)
人工智能·华为·wpf·harmonyos