
过去几年,量化投资在A股的热度堪比AI。无论是私募大佬还是券商自营,甚至不少个人投资者,都在谈"Alpha因子""多因子模型""机器学习选股"。 但当越来越多的人都在用相似的模型、相同的因子、同一套回测框架时,问题就来了------当所有人都在跑同一个因子,我们还能赚谁的钱?
一、量化的"同质化陷阱"
量化的本质,是信息优势的系统化提炼。 但当这种"优势"被公开、被复制、被规模化执行时,优势就不再是优势了。
1. 因子暴露趋同 ------ "模型长得越来越像"
- 多数量化团队都依赖于价值(低 PE/PB)、动量(过去 3--12 个月涨幅)、质量(ROE / 净利润增速)等因子,导致不同机构的组合重合度极高。
- 在"星火多因子"系列报告里,就曾提到 A 股多因子模型在构建时普遍使用这种因子集合(价值 + 动量 + 质量 + 风险因子等)。
- 在"财新 · 智能贝塔"系列报告中,也可以看到 Smart Beta 因子指数对这些传统因子的重复暴露分析。
- 结果是,不同量化基金即便名字、侧重点不同,跑出来的前 30 或前 50 支股票,往往有很高的重合率,真正能差异化的暴露越来越少。
2. 回测优异 ≠ 实盘稳健 ------ 同质化让模型脆弱
- 在同质化环境下,回测中的"因子 alpha"更容易是截面条件 或者市场风格恰好偏好的产物,而非真正的策略优势。
- 一旦市场风格逆转或风格切换,那些高度相似的模型会同时受伤,导致普遍回撤。
- 例如在 2023 年下半年,低估值、价值驱动风格突然失宠,很多量化产品出现大面积回撤。
- 最近东方财富的报告也指出,量化策略当前面临 不稳定因子数量上升、回撤风险放大 的问题。
3. 交易成本与冲击成本的放大
- 当很多策略都在 同一因子方向集中买入或卖出某些股票时,这些交易本身就成了市场压力。
- 流动性较差的小盘股,会因为资金集中进出而产生较大的滑点、冲击成本,从而削弱因子收益。
- 在极端时期,这种拥挤交易甚至会带来反馈式的连锁挤压。
4. 被动 / 指数增强策略的挤压
- 随着智能贝塔、ETF、指数增强策略在中国越来越被接受,越来越多资金被动或半被动地暴露于"风格因子篮子"。
- 这些策略本身就是在复制因子组合,进一步加剧了市场上的风格暴露叠加。
- 这就像在量化圈内拉起一个"因子共识博弈",竞争不是谁跑出新的因子,而是谁在"拥挤里活下来"。
所以在 A 股量化的实战环境里,大家都跑同样的因子(价值、动量、质量等),久而久之------模型开始趋同,重仓股重叠严重;回测里表现优异的因子,一旦市场风格切换就集体受伤;交易成本、流动性冲击把原本的 Alpha 消耗殆尽;而被动或指数增强类策略又不断加码这些因子,使得市场风格暴露更加拥挤。
这种"同质化陷阱"的存在,是量化人士必须警惕的结构性风险。
这就像所有人都拿着相同的藏宝图去挖金子,最后结果是:
金子被提前挖光,剩下的只是坑坑洼洼的土地。😂
二、回测的"幻觉":纸面Alpha的集体沉沦
很多量化新手在入行时,最喜欢做的事就是------ 在回测上"挖因子" 。 但现实是: 在A股,回测能赚钱 ≠ 实盘能赚钱。
1️⃣ 数据穿越
很多公开数据集的财报发布日期并非真实披露时间。
模型"偷看"了未来信息,回测自然漂亮。
2️⃣ 调仓摩擦与滑点
回测中我们默认按收盘价买卖、无摩擦成本。
但实际交易中滑点、冲击成本、成交率问题会把年化收益从20%打回个位数。
3️⃣ 因子挤兑效应
即使你的模型没问题,只要别人也在跑同一个逻辑 ,
当市场风格切换、资金出逃时,这类因子会集体"坍塌"。
典型如2023年下半年,小盘风格反转、低估值因子崩盘,
一大批量化模型的净值回撤达20%以上。
三、资金结构的改变:量化从"套利者"变成了"被套利者"
早期的量化基金规模较小,更多扮演的是流动性提供者 角色。
他们发现市场错价------>套利------>修正价格。
这是健康的市场行为。
但如今,量化私募管理规模数以万亿,
高频、低延时、指数增强、Alpha选股策略层出不穷。
当量化资金自身成了主导力量时,他们的交易本身反而影响了市场价格。
于是我们看到:
- 同一风格的股票同时暴涨暴跌;
- 因子收益在短期内剧烈波动;
- 模型的有效期越来越短。
一句话总结:
量化从"猎人"变成了"猎物"。
四、如何破局?------从"拥挤度指标"谈起
要想在量化红海中突围,我们首先要回答一个问题:
我的因子现在是不是太拥挤了?
👉 拥挤度指标的核心思路:
1️⃣ 持仓重合度分析
- 把市场上主要公募、量化私募的重仓股公开数据取出。
- 计算不同机构间的Top持仓重叠比例(Jaccard Similarity)。
- 如果相似度持续上升,说明因子暴露高度重叠。
2️⃣ 交易拥挤度
- 分析因子多空组合的资金流向、成交量偏离度。
- 当一个因子方向上成交量异常集中(比如低估值股连续被扫货), 拥挤度飙升。
3️⃣ 因子收益波动率
- 拥挤度越高的因子,在市场回撤时往往回撤更猛烈。
- 可以把"因子IC的波动率"视作一种隐性风险指标。
💡一个实用做法是构建一个"拥挤度因子",
在模型中加入一个"拥挤度惩罚项":
当某个因子的拥挤度高,就降低其权重。
这其实是一种"量化反身性"思维。
五、个性化Alpha与异质数据
破局的关键,不是去挖"别人没挖的因子",
而是让你的Alpha更具差异性、更具持续性。
方向上,我认为可以从三条线走:
1️⃣ 异质数据(Alternative Data): 比如招投标公告、新闻舆情、企业招聘、卫星数据等。 这些数据的信号密度低,但竞争少。
2️⃣ 风格动态调整模型 : 不再固守"价值""动量"等静态风格,
而是让模型根据市场状态自适应切换。
3️⃣ 拥挤度监控体系: 让你的系统实时监控"因子热度"和"资金拥挤", 当信号拥挤度高时,主动降杠杆或转向中性策略。
量化不死,但公式会老
量化投资不是神话,它只是统计学与市场行为的结合。
当市场参与者越来越多,
"公式化"的策略必然被市场消化。
真正的Alpha,永远来自对市场结构变化的洞察 ,
以及敢于重新定义边界的创新精神。
当所有人都在跑同一个因子时,你唯一能赚的钱------是那些还没意识到规则变了的人的钱。
今天的分享就到这里了,下一篇我们讲讲如何落地一个"拥挤度指标"