神秘大奖章的新进化
全球最神秘的量化对冲基金------文艺复兴科技(Renaissance Technologies)在2026年4月向投资者披露的半年度信中透露,其旗舰基金"大奖章"(Medallion)已全面引入基于大语言模型(LLM)和生成式AI的"另类数据因子"。这是文艺复兴自2010年将机器学习引入框架后最大的一次方法论更新。
信中提到,新因子利用预训练语言模型分析公司财报电话会、联邦公开市场委员会(FOMC)纪要、新闻报道以及社交媒体情绪。与传统的情感分析不同,LLM能够识别"潜在矛盾"和"细微语气"------例如,一位CEO在业绩会上反复使用被动语态可能预示着未来的盈利下调,而这种信号量化指标无法捕捉。初步回测显示,加入LLM因子后,大奖章在2024-2025年的模拟年化夏普比率从4.2提升至5.1。
量化行业整体回暖
文艺复兴的突破并非孤例。经历了2023-2024年因美联储加息和宏观波动导致的低谷后,量化基金行业在2025年下半年重获生机。对冲基金研究机构HFR的数据显示,量化基金在2026年第一季度的平均收益率为5.8%,远高于主观选股基金的2.1%,也跑赢了标普500的4.3%。
驱动这一复苏的主要因素有三:市场波动率回归正常水平(VIX平均14-17)、更高质量的高频数据可用性增加,以及硬件(GPU加速)和软件(PyTorch 3.0的新算子)的快速迭代。Two Sigma、Citadel和DE Shaw等头部机构均在2026年扩大了量化研究团队的招聘,其中机器学习工程师的薪酬甚至超过了传统算法开发人员。
AI因子拥挤风险浮现
然而,量化界并不完全乐观。一个公认的风险是策略同质化。几乎所有大型量化基金都在使用相似的LLM模型和第三方另类数据(如卫星图像、信用卡刷卡记录、移动定位数据),导致因子拥挤和收益衰减。摩根大通量化策略团队在4月发布的研究报告中指出,自2025年以来,AI相关因子的夏普比率平均每半年衰减0.3,远快于传统价值因子的衰减速度。
文艺复兴在信中对此的回应是:"我们并不依赖公开的LLM模型(如GPT-5或Gemini),而是使用完全自研的小型专用模型,并在独家数据源上训练,包括过去20年存储的全部电话录音及场外交易数据。"文艺复兴的数据壁垒和模型不透明性,正是其能长期超越同行的重要原因。
另类数据市场蓬勃兴起
量化基金对AI因子的追捧催生了另类数据市场的高速增长。根据分析机构Neudata的统计,2026年第一季度,全球另类数据供应商的数量首次超过1000家,年交易额达到65亿美元,同比增长48%。最受欢迎的品类包括:消费者刷卡数据(非聚合),电商列表抓取数据,以及仓储物流追踪信息。
数据合规问题也随之而来。美国证券交易委员会(SEC)在2026年3月处罚了一家数据经纪商,因其将匿名化的手机定位数据重新识别出具体个人并出售给对冲基金。SEC主席表示,将对"通过非公开信息来源获得交易优势"的行为进行更严格的监管。新的草案要求,任何使用替代数据的基金必须能够证明数据来源不侵犯隐私,也不违反网站服务条款。
散户能否参与其中?
对于普通投资者,文艺复兴和Two Sigma的投资门槛极高(大奖章基金多年前就不再对外部资金开放)。然而,通过另类ETF,散户也可以部分参与这一趋势。2025年末推出的"AI量化因子ETF"(代码QAI)追踪一篮子基于机器学习模型选股的公开策略,其2026年至今的收益率为5.2%,与行业平均水平接近。但批评者指出,公开策略会立即被其他市场参与者套利,实际可获得的alpha远低于不透明的内部策略。
长期来看,量化基金的AI化是一场军备竞赛。能够持续胜出的机构将具备独特的数据源、专有的模型架构以及快速的GPU算力基础设施。而资金规模较小、技术自主性差的基金将被边缘化。量化对冲基金将越来越像科技公司,而不是金融公司。