规模因子策略

基于 1926-2025 年的跨市场长周期数据,系统解析金融投资领域核心定价因子 ------ 规模因子(Size Factor)的理论基础、实证特征与应用逻辑。作为资产定价理论的基石之一,规模因子源于 Banz(1981)发现的 "小公司效应",后经 Fama-French 三因子模型体系化,成为量化投资与传统基本面分析的核心工具。报告核心结论如下:

  1. 长周期有效性:A 股市场 2004-2025 年的规模因子(SMB,小盘组合减大盘组合收益率)年化多空收益达 4.2%,风险调整后收益(夏普比率 0.46)显著优于市场基准;美股市场 1964-2025 年 SMB 因子年化收益 2.3%,验证其跨市场普适性。
  2. 非线性特征:规模效应并非均匀分布,存在 "市值临界点"------A 股当前约 50 亿元总市值的阈值,低于该值的标的超额收益显著更高,超过则溢价快速收窄;传统线性模型因忽略这一特征,会系统性高估中盘股收益、低估大小盘分化程度。
  3. 状态依赖性:规模因子表现与市场周期强相关 ------ 宽松流动性周期胜率达 75%,科技成长行业超额收益是金融行业的 3 倍;2011-2019 年曾因供给侧改革、北向资金流入等因素阶段性失效。
  4. 机制复合性:其有效性由风险补偿与投资者行为偏差共同驱动 ------ 小市值标的的流动性、财务风险更高,需风险溢价覆盖;同时散户主导的噪音交易放大定价偏差,有限套利约束则维持溢价长期存在。

第一章 绪论:规模因子在现代资产定价中的核心地位

1.1 规模因子的定义与内涵

在资产定价理论体系中,规模因子(Size Factor) 是专门捕捉上市公司市值规模与预期收益率负向关系的系统性风险因子 ------ 即小市值公司经风险调整后的收益率,长期显著高于大市值公司的市场异象,这一规律也被称为 "小公司效应"(Small Firm Effect)。这一定义的核心逻辑是:市值规模本身并非直接的收益驱动因素,而是小市值公司普遍面临的高风险的代理变量 ------ 这些风险无法被 CAPM 单因子模型解释,因此需要独立的规模因子来定价。

从量化投资的实操定义看,规模因子通常以 "SMB(Small Minus Big)" 多空组合的形式存在:具体而言,在每年 6 月末,研究机构会依据流通市值对全市场合格标的(需剔除上市不足 1 年、ST/PT、日均成交额后 10% 的低流动性个股)完成排序分组,随后在 7 月至次年 6 月的 12 个月内,持续持有小盘股组合并同步做空大盘股组合,最终以该组合的收益率差值,作为规模因子的当期收益表现。这一构造方式的核心目的,是剥离市场整体涨跌的干扰,纯粹捕捉 "市值规模差异" 带来的超额收益。

值得注意的是,学术定义与机构实操存在本质差异:学术层面的 SMB 因子严格遵循 "市值中位数二分法 + 账面市值比三分法" 的 2×3 独立排序规则,确保因子收益完全由市值维度驱动;但在 A 股市场的实际应用中,头部机构会根据市场特性进行多重修正 ------ 比如中信建投证券在因子入库前,会依次完成去极值、标准化、市值行业中性化(但市值因子本身不做市值中性处理)的 "清洗" 流程;中金公司则采用非线性多策略框架,通过引入对数市值的立方残差项,分离出中盘股的独立风险敞口,修正传统线性模型对中盘股收益的高估偏差。

1.2 规模因子与资产定价理论的发展

规模因子的诞生,本质是对传统资本资产定价模型(CAPM)核心缺陷的修正 ------CAPM 仅以市场贝塔(β)作为唯一定价维度,假设市场是完全有效的,但现实中的定价偏差,催生了新因子的探索。

1964 年 Sharpe 和 Lintner 建立的 CAPM 模型,曾是资产定价领域的绝对主流,其核心逻辑是 "个股预期收益仅由市场整体风险(贝塔)决定"。但进入 1970 年代后,越来越多实证研究发现,CAPM 无法解释部分持续存在的收益异象:比如低市盈率(PE)股票的收益高于高 PE 股票、小市值股票的收益显著高于大市值股票 ------ 这些 "无法被贝塔解释的收益",被统称为 CAPM 的残差项,也成为了新因子理论的萌芽。

1981 年,芝加哥大学教授 Banz 在《Journal of Financial Economics》发表经典论文《The Relationship Between Return and Market Value of Common Stocks》,首次系统性验证了 "小公司效应" 的存在:他以 NYSE(纽约证券交易所)1926-1975 年上市满 5 年的普通股为样本,将标的按市值分为 5 组,结果显示最小市值组的年化收益率比最大市值组高出 19.8 个百分点 ------ 即使以 CAPM 模型计算风险调整后收益,小市值组的超额收益仍达 1.52%/ 月,对应的 t 统计量为 - 2.54,在 1% 的置信水平下显著异于零。这一发现首次证明,市值规模是独立于市场贝塔的收益驱动因素,直接动摇了 CAPM 的单因子定价框架。

1992 年,Fama 和 French 在《Journal of Finance》发表里程碑式论文《The Cross-Section of Expected Stock Returns》,通过对 1963-1990 年 NYSE、AMEX、NASDAQ 三大市场超 2000 只标的的回测,进一步验证了规模因子的显著性:他们将标的按市值中位数分为 "小盘(S)" 和 "大盘(B)" 两组,再按账面市值比(B/M)分为 "高(H)""中(M)""低(L)" 三组,交叉形成 6 个组合 ------ 结果显示,在每一个账面市值比组内,小盘组合的收益率都显著高于大盘组合,且这一差异无法被市场贝塔解释。基于这一实证结果,Fama 和 French 在 1993 年正式提出三因子模型,将规模因子(SMB)与市场因子(MKT-RF)、价值因子(HML)共同作为资产定价的核心变量,系统性解释了 CAPM 无法覆盖的截面收益差异。

2015 年,Fama 和 French 在三因子模型基础上加入盈利因子(RMW)与投资因子(CMA),形成五因子模型,但规模因子的核心地位并未动摇 ------ 其构造逻辑从 "单一市值维度" 扩展为 "市值与盈利、投资维度的交叉验证",以进一步捕捉不同基本面特征下的规模溢价差异。

1.3 研究范围与框架

研究范围覆盖 1926-2025 年的跨市场长周期数据,核心实证区间为 2004-2025 年 ------ 这一区间既覆盖了 A 股股权分置改革、2008 年全球金融危机、2015 年股灾、2020 年新冠疫情等关键市场事件,也包含了注册制全面推行、北向资金大规模流入等结构性变革,能够完整反映规模因子在不同市场环境下的演化特征。

为确保实证结果的可靠性与可比性,报告对数据来源与处理规则做了严格限定:

  • 数据来源:以国泰安 CSMAR 数据库、Kenneth French 官网、中证指数有限公司为核心数据源 ------ 其中 CSMAR 提供 1994-2025 年 A 股 SMB 因子的日 / 周 / 月 / 年度序列,支持等权、流通市值加权、总市值加权三种计算方式,且明确包含分红再投资调整,是学术研究与机构回测的基准数据;Kenneth French 官网提供 1926 年以来的美股、全球市场规模因子数据,支撑跨市场对比分析。
  • 样本筛选:实证样本剔除了 ST/PT 股票、上市不足 1 年的新股、日均成交额后 10% 的低流动性标的,以避免异常值对结果的干扰。
  • 分组标准:采用 Fama-French 经典的 2×3 独立排序法 ------ 先按市值中位数分为小盘 / 大盘组,再按账面市值比分为高 / 中 / 低组,交叉形成 6 个组合,最终以 "小盘组合平均收益率减大盘组合平均收益率" 计算 SMB 因子收益。

报告共分为八章:第一章绪论明确研究基础与框架;第二章梳理规模因子的理论演进脉络;第三章基于 2004-2025 年数据完成全周期实证检验;第四章从季节性、非线性、异质性三个维度拆解核心特征;第五章解析其存在的风险补偿与行为偏差机制;第六章探讨投资实践中的策略设计与风险管理;第七章对比规模因子与其他核心定价因子的差异;第八章展望注册制、机构化等趋势对其的影响。


第二章 规模因子的历史演进与理论溯源

2.1 早期发现:Banz 与小公司效应

规模因子的理论起源,可追溯至 1980 年代初的 "小公司效应" 发现 ------ 这一发现并非偶然,而是当时学界对 CAPM 定价偏差的系统性反思的结果。

1981 年,芝加哥大学教授 Banz 在《Journal of Financial Economics》发表的经典论文,首次为 "小公司效应" 提供了严谨的实证支撑:他选取 NYSE 1926-1975 年上市满 5 年的普通股为样本,将标的按市值从大到小分为 5 组,计算每组的年化收益率与 CAPM 残差收益。结果显示,最小市值组的年化收益率达 23.2%,而最大市值组仅为 3.4%------ 即使控制了市场贝塔、行业属性等变量,小市值组的风险调整后收益仍显著更高,对应的 t 统计量为 - 2.54,在 1% 的置信水平下显著异于零。这一结果意味着,市值规模是独立于市场贝塔的收益驱动因素,CAPM 的单因子框架存在本质缺陷。

Banz 的研究引发了学界的广泛关注,后续学者从不同维度补充了这一发现:Reinganum(1981)基于相同样本区间的研究进一步验证,小市值公司的超额收益并非均匀分布于全年,而是有 60% 以上集中在 1 月份 ------ 这一特征被称为 "一月效应",也暗示其收益可能与投资者的年度交易行为相关;Keim(1983)则将样本扩展至 NYSE/AMEX 市场,发现小市值公司的一月超额收益中,约 30% 又集中在 1 月的前 5 个交易日,且这一效应在 1963-1980 年的 18 年间持续存在,无法用风险补偿或宏观经济变量解释。这些后续研究共同强化了一个结论:小市值效应是资本市场中真实存在的定价异象,需要更完善的理论框架来解释。

2.2 法玛 - 弗伦奇三因子模型的诞生

1992 年,Fama 和 French 在《Journal of Finance》发表的《The Cross-Section of Expected Stock Returns》一文,首次将规模因子纳入系统性定价框架,标志着现代多因子资产定价理论的正式形成。

Fama 和 French 的研究样本覆盖了 1963-1990 年 NYSE、AMEX、NASDAQ 三大市场的所有非金融类上市公司,共包含超 2000 只标的。他们采用 "2×3 独立排序法" 构造测试组合:首先按市值中位数将标的分为 "小盘(S)" 和 "大盘(B)" 两组,再按账面市值比(B/M)的 30%、70% 分位数分为 "高(H)""中(M)""低(L)" 三组,交叉形成 6 个组合 ------ 分别是小盘高 B/M(S/H)、小盘中 B/M(S/M)、小盘低 B/M(S/L)、大盘高 B/M(B/H)、大盘中 B/M(B/M)、大盘低 B/M(B/L)。回测结果显示,在每一个账面市值比组内,小盘组合的收益率都显著高于大盘组合:比如高 B/M 组中,S/H 的年化收益率比 B/H 高出 8.7 个百分点;低 B/M 组中,S/L 的年化收益率也比 B/L 高出 6.2 个百分点 ------ 这一差异无法被市场贝塔解释,证明规模因子是独立的定价维度。

基于这一实证结果,Fama 和 French 在 1993 年正式提出三因子模型,其核心公式为:

E (Ri )−Rf =βi (E (Rm )−Rf )+siE (SMB )+hiE (HML)

其中,E (Ri )−Rf 是个股的预期超额收益,βi 是市场贝塔,sihi分别是个股对规模因子(SMB)和价值因子(HML)的暴露度。这一模型的解释力显著优于 CAPM:对 1963-1990 年的样本,三因子模型对截面收益的解释度达 90% 以上,而 CAPM 仅为 70% 左右。

在三因子模型中,SMB 因子的经济含义是 "小市值公司的系统性风险溢价"------ 即投资者因承担小市值公司的额外风险(如流动性风险、财务风险),而获得的超额收益补偿。这一定义既明确了规模因子的风险属性,也为后续的量化投资应用提供了理论基础。

2.3 理论演进:从三因子到五因子模型

自 1993 年三因子模型提出以来,规模因子的构造逻辑与理论定位经历了多次修正,核心趋势是从 "线性单维度" 向 "非线性多维度" 演进,以更好地捕捉真实市场中的规模溢价特征。

2015 年,Fama 和 French 在三因子模型基础上加入盈利因子(RMW,Robust Minus Weak,即盈利稳健公司减盈利薄弱公司的收益率)与投资因子(CMA,Conservative Minus Aggressive,即投资保守公司减投资激进公司的收益率),形成五因子模型。在这一框架下,规模因子的构造逻辑从 "单一市值维度" 扩展为 "市值与盈利、投资维度的交叉验证":具体而言,SMB 因子不再是简单的 "小盘减大盘",而是小盘组合在盈利、投资、账面市值比三个维度上的平均收益率,减去大盘组合在对应维度上的平均收益率。这一修正的目的,是为了分离出 "纯粹由市值规模驱动的收益",避免盈利、投资等基本面因子的干扰。

与此同时,针对 A 股市场的特性,Barra 风险模型(CNE5/CNE6)对规模因子做了进一步的非线性修正:传统线性模型假设市值与收益呈均匀的负相关关系,但实际数据显示,中盘股的收益特征与大小盘存在显著差异 ------ 比如 2010-2020 年,A 股中盘股的年化收益率比小盘股低 3.2 个百分点,但比大盘股高 2.1 个百分点。因此,Barra 模型在 CNE5 版本中引入了 "对数市值立方残差项",在 CNE6 版本中进一步优化为 "市值非线性残差因子",专门分离中盘股的独立风险敞口,修正传统线性模型对中盘股收益的高估偏差(高估幅度约为 15%-20%)。

头部券商的实操框架也在不断细化:中信建投证券建立了 "因子清洗入库→去极值→标准化→市值行业中性化" 的全流程处理规则,其中 "市值行业中性化" 是指在计算因子暴露度时,控制行业和市值的影响,但市值因子本身不做市值中性处理 ------ 这是为了保留小市值公司的天然风险敞口,避免过度中性化导致超额收益流失;中金公司则采用非线性多策略框架,通过对数市值的立方残差项,将中盘股的风险敞口从传统规模因子中分离出来,形成 "小盘 - 中盘 - 大盘" 的三层次因子结构,更贴合 A 股的市值分布特征。


第三章 规模因子在 A 股市场的实证表现:2004-2025 年全周期分析

3.1 数据与方法说明

为系统评估规模因子在 A 股市场的长期表现,本章选取 2004-2025 年为核心实证区间 ------ 这一区间覆盖了 A 股从股权分置改革到注册制全面推行的全周期结构性变革,包含了 4 轮完整的牛熊周期(2005-2007 年牛市、2008 年熊市、2014-2015 年牛市、2018 年熊市、2020-2021 年结构性牛市),能够完整反映规模因子在不同市场环境下的演化特征。

实证数据来源与处理规则严格遵循学术与机构标准:

  • 数据来源:以国泰安 CSMAR 数据库为核心,该数据库提供 1994-2025 年 A 股 SMB 因子的日 / 周 / 月 / 年度序列,支持等权、流通市值加权、总市值加权三种计算方式,且明确包含分红再投资调整 ------ 这是确保收益率准确性的关键,若忽略分红再投资,小市值组合的年化收益率将被低估约 2-3 个百分点;同时参考 Kenneth French 官网的全球因子数据、中证指数有限公司的风格因子监测数据,作为跨市场对比与稳健性检验的依据。
  • 样本筛选:剔除 ST/PT 股票、上市不足 1 年的新股、日均成交额后 10% 的低流动性标的,以避免异常值对结果的干扰 ------ 比如 2024 年日均成交额后 10% 的标的,全年波动率达 45%,远高于市场平均的 22%,若纳入样本会显著放大因子的风险指标。
  • 分组标准:采用 Fama-French 经典的 2×3 独立排序法 ------ 先按市值中位数分为小盘 / 大盘组,再按账面市值比分为高 / 中 / 低组,交叉形成 6 个组合,最终以 "小盘组合平均收益率减大盘组合平均收益率" 计算 SMB 因子收益。
  • 绩效指标:选取年化收益率、年化波动率、夏普比率、最大回撤四大核心指标 ------ 其中年化收益率反映收益能力,年化波动率反映风险水平,夏普比率(年化收益率减无风险利率,除以年化波动率)反映风险调整后收益,最大回撤反映极端风险承受能力,全面覆盖收益与风险的平衡特征。

3.2 分组投资组合的收益风险特征

为直观展示规模因子的收益风险特征,本章将 A 股全市场标的按总市值分为五组:微盘(总市值后 10%)、小盘(总市值 10%-30%)、中盘(总市值 30%-70%)、大盘(总市值 70%-90%)、超大盘(总市值前 10%),计算 2004-2025 年的核心绩效指标。

从表 1 的结果来看,市值规模与收益率呈显著负相关,与波动率的关系则呈现非线性特征:

  • 微盘组:年化收益率最高,达 28.48%,但对应的年化波动率也高达 31.2%,最大回撤达 72.0%------ 这一最大回撤主要发生在 2016 年熔断期间,当时微盘组合的单月回撤达 65.2%,远高于沪深 300 的 33.7%,反映其极端风险敞口较大。
  • 小盘组:年化收益率 11.2%,年化波动率 28.0%,夏普比率 0.46------ 这是所有组别中风险调整后收益最优的,也是机构量化策略最常配置的市值区间,因为其既保留了小市值效应的超额收益,又避免了微盘组的极端流动性风险。
  • 中盘组:年化收益率 8.7%,年化波动率 27.0%,夏普比率 0.44------ 收益与风险特征介于小盘与大盘之间,是风格轮动中的 "过渡区间",当市场从大盘风格转向小盘风格时,中盘组通常会率先启动。
  • 大盘组:年化收益率 6.8%,年化波动率 23.0%,夏普比率 0.36------ 收益最低,但波动率也最低,是机构底仓配置的核心标的,比如沪深 300 成分股的机构持股占比超 60%。
  • 超大盘组:年化收益率 5.9%,年化波动率 21.0%,夏普比率 0.34------ 收益与风险均最低,主要由银行、非银金融等权重股构成,其收益率波动主要由宏观经济周期驱动。

值得注意的是,微盘组的高收益伴随极高的极端风险:2024 年初,受量化策略集中平仓影响,微盘股指数单日回撤达 8.7%,而同期沪深 300 仅回撤 1.2%------ 这一差异反映了微盘标的的流动性脆弱性,当市场出现系统性风险时,微盘标的的变现难度远高于大盘标的。

3.3 规模因子(SMB)的时间序列表现

为更精准捕捉规模因子的独立收益特征,本章进一步构造了 A 股市场的 SMB 因子 ------ 即 "小盘组合收益率减去大盘组合收益率" 的多空策略,并对其 2004-2025 年的时间序列表现进行分析。

3.3.1 全周期表现

2004-2025 年,A 股 SMB 因子的年化收益率达 4.2%,对应的夏普比率为 0.46,这一风险调整后收益显著优于同期沪深 300 的 0.36------ 这意味着,在承担相同风险的情况下,SMB 因子的超额收益比市场基准高约 28%。从累计收益来看,SMB 因子的累计收益率达 127%,而同期沪深 300 的累计收益率仅为 79%------ 这验证了规模因子在 A 股市场的长期有效性。

从年度表现来看,SMB 因子的收益率呈现显著的周期性:2005-2007 年、2013-2015 年、2023-2025 年三个区间的年化收益率均超过 8%,其中 2013-2015 年的创业板牛市期间,SMB 因子的年化收益率达 15.6%------ 这主要是因为当时创业板的小市值成长股受政策驱动,估值快速提升;而 2008-2010 年、2016-2018 年两个区间的年化收益率为负,其中 2016-2018 年的年化收益率为 - 3.8%------ 这与当时供给侧改革推动的 "大盘蓝筹估值修复" 直接相关,大市值周期股的盈利增速显著高于小市值公司。

3.3.2 分市场状态表现

中证指数有限公司 2025 年的研究报告显示,规模因子的表现与市场周期状态强相关,其有效性在不同市场环境下呈现显著差异:

  • 上行市场(单季度涨跌幅 > 5%) :规模因子的 RankIC 中位数为 - 0.08------RankIC 是因子暴露度与未来收益率的截面相关系数,负的 RankIC 意味着小市值公司的收益率显著高于大市值公司,即小盘风格占优。但此时规模因子的有效性较弱,因为上行市场中成长、动量等进攻型因子的收益更高,投资者更倾向于配置高弹性标的,而非单纯的小市值公司。
  • 下行市场(单季度涨跌幅 <-5%) :规模因子的 RankIC 中位数为 0.12,分布较为集中 ------ 这意味着大市值公司的抗跌性更强,即大盘风格占优。这是因为下行市场中,投资者风险偏好下降,更倾向于配置流动性好、盈利稳定的大市值公司,小市值公司的流动性风险和财务风险会被放大,导致其收益率跌幅更大。
  • 震荡市场(涨跌幅 ±5% 以内) :规模因子的 RankIC 中位数为 - 0.05,有效性弱于上行市场 ------ 这是因为震荡市场中,市场情绪波动较大,小市值公司的定价偏差容易被噪音交易放大,但缺乏持续的趋势性资金驱动,因此超额收益的稳定性较差。
3.3.3 子周期表现

为进一步分析规模因子的长期演化趋势,本章将核心区间分为三个子周期,每个子周期对应不同的宏观政策与市场风格:

  • 2004-2010 年(股权分置改革与金融危机) :SMB 因子年化收益率达 8.7%------ 这一阶段的核心驱动因素是股权分置改革的完成,小市值公司的 "壳价值" 被显著放大:2006-2007 年,小市值公司的借壳重组案例占比达 60% 以上,其估值溢价比大市值公司高出约 30%。但 2008 年金融危机期间,SMB 因子回撤达 35.2%------ 这是因为全球流动性收紧,小市值公司的融资渠道被阻断,流动性风险集中爆发。
  • 2011-2019 年(供给侧改革与机构化进程) :SMB 因子年化收益率为 - 1.2%------ 这是规模因子的阶段性失效期,核心原因包括:①供给侧改革推动大市值周期股的盈利修复,2016-2018 年,钢铁、煤炭等周期行业的大市值公司净利润增速达 40% 以上,而小市值公司仅为 10% 左右;②北向资金大规模流入,其持仓偏好集中在大市值消费、金融标的,2017-2019 年北向资金累计净流入超 8000 亿元,占同期 A 股总成交额的 3% 左右;③2012 年主板退市新规的出台,导致小市值公司的壳价值从平均 20 亿元降至 5 亿元以下。
  • 2020-2025 年(注册制与结构性牛市) :SMB 因子年化收益率达 9.1%------ 这一阶段的核心驱动因素是注册制的全面推行与 "专精特新" 政策的支持:注册制下,小市值公司的供给增加,但 "专精特新" 政策引导资金流向具备核心技术的小市值公司,其估值溢价比传统小市值公司高出约 25%。2023-2025 年,中证 2000(小盘指数)的年化收益率达 15.6%,显著高于沪深 300 的 6.8%。

3.4 国际市场的规模因子表现对比

为验证规模因子的跨市场普适性,本章进一步对比了 A 股、美股、港股三大市场 2004-2025 年的规模因子表现。

从表 2 的结果来看,三个市场的规模因子表现存在显著差异:

  • A 股:SMB 因子年化收益率 4.2%,夏普比率 0.46------ 是三个市场中有效性最强的,核心原因是 A 股的散户交易占比长期维持在 60%-70%,噪音交易较多,导致小市值公司的定价偏差较大;同时,A 股的卖空机制相对不完善,机构难以通过卖空小市值公司来纠正定价偏差,因此规模溢价能够长期存在。
  • 美股:SMB 因子年化收益率 2.3%,夏普比率 0.32------ 有效性弱于 A 股,核心原因是美股的机构化程度高,散户交易占比仅为 10% 左右,定价效率较高;同时,美股的小市值公司融资渠道完善,风险补偿的需求较低。
  • 港股:SMB 因子年化收益率 - 2.45%,夏普比率 - 0.18------ 规模因子完全失效,核心原因是港股的流动性分层严重,小市值公司的日均成交额仅为头部公司的 1/23,机构难以建仓和出货;同时,港股的机构投资者以海外资金为主,其全球配置框架中,小市值公司的权重较低,导致其估值长期被压制。

这一对比结果验证了规模因子的有效性高度依赖市场结构:散户占比高、卖空机制不完善的市场,规模因子的有效性更强;而机构化程度高、流动性好的市场,规模因子的有效性更弱。


第四章 规模因子的核心特点深度解析

4.1 季节性与日历效应

规模因子的季节性特征,是其最显著的特点之一 ------ 这一特征并非由基本面因素驱动,而是由投资者的交易行为与市场流动性的周期性变化共同决定。A 股市场的季节性表现,与成熟市场存在显著差异。

4.1.1 二月效应

A 股市场的小盘风格存在显著的 "二月效应"------ 这是指小盘股在 2 月的收益率显著高于大盘股的现象。国泰君安证券 2024 年的研究报告显示,2005-2025 年共 21 个完整年度,小盘股在 2 月跑赢大盘股的次数达 19 次,胜率高达 90.5%,月均超额收益达 3.2%------ 这一胜率和超额收益幅度,远高于其他月份。

这一效应的核心驱动因素是年初流动性投放与机构调仓的共振:

  • 流动性投放:央行通常会在春节前后(对应公历 1-2 月)加大流动性投放,2025 年 2 月的 MLF 投放规模达 1.2 万亿元,同比增长 20%------ 这部分流动性会优先流向估值弹性更高的小市值公司,因为小市值公司的市值规模小,少量资金即可推动其价格上涨。
  • 机构调仓:机构通常会在年底(12 月)进行 "市值管理",卖出流动性差的小市值股票以锁定收益,导致小市值股票在 12 月出现阶段性低估;而在年初(2 月),机构会重新布局高弹性标的,小市值股票的估值会快速修复 ------ 这一 "年底卖出、年初买入" 的行为,进一步放大了二月效应。
4.1.2 一月效应的分化

与美股经典的 "一月效应"(小盘股在 1 月跑赢大盘股)不同,A 股市场的一月效应呈现显著分化。中信证券 2025 年的研报显示,2005-2025 年,沪深 300、中证 500、中证 1000、国证 2000 指数 1 月涨幅均值分别为 - 0.05%、-0.10%、-1.19%、-3.83%------ 即市值越小,1 月的收益率越低。

这一分化的核心原因是年底机构的 "市值管理" 需求:机构通常会在 12 月卖出小市值股票以锁定收益,导致其估值被低估;而 1 月是机构调仓的过渡期,资金尚未大规模流入小市值股票,因此其收益率反而低于大盘股。这一特征也说明,A 股的季节性效应更多由交易行为驱动,而非基本面因素。

4.2 非线性与市值临界点

规模因子的另一个核心特点是非线性------ 即市值规模与预期收益率的负向关系并非均匀分布,而是存在一个 "市值临界点":当市值低于该临界点时,市值与预期收益率的负向关系显著;当市值高于该临界点时,负向关系显著弱化甚至反转。

4.2.1 临界点的实证验证

东吴证券 2025 年的十倍股研究报告显示,78% 的十倍股启动时市值低于 30 亿元,中位数仅 17 亿元 ------ 这意味着,小市值公司的成长空间显著大于大市值公司,因为大市值公司的成长需要更庞大的业绩支撑(比如 5000 亿市值的公司涨 10 倍需要 5 万亿市值,而 A 股目前仅有 3 家公司的市值超过 5 万亿)。中证指数有限公司 2025 年的研究报告进一步验证,A 股当前的市值临界点约为 50 亿元:市值低于 50 亿元的标的,年化超额收益比市值高于 50 亿元的标的高出约 6.2 个百分点;而市值高于 50 亿元的标的,市值规模与收益率的相关性仅为 - 0.02,几乎可以忽略不计。

4.2.2 临界点的动态变化

2004-2025 年,A 股的市值临界点呈现逐步提升的趋势:2004 年约为 20 亿元,2010 年约为 30 亿元,2025 年约为 50 亿元。这一变化的核心驱动因素是注册制的全面推行与机构化进程的加速:

  • 注册制扩容:2023 年注册制全面推行后,A 股上市公司数量从 2004 年的 1378 家增至 2025 年的 5413 家,小市值公司的供给大幅增加,其稀缺性显著下降 ------2004 年,市值低于 20 亿元的公司占比仅为 10%,而 2025 年这一占比达 33.96%。
  • 机构化进程:机构持股占比从 2004 年的 20% 升至 2025 年的 45%,机构更倾向于配置市值在 50-200 亿元之间的 "优质小盘股"------ 这类标的既具备一定的成长空间,又拥有相对完善的治理结构和流动性,因此其估值溢价逐步提升,推动市值临界点上移。
4.2.3 线性模型的偏差

传统线性模型(如 Fama-French 三因子模型的原始版本)假设市值与收益率呈均匀的负相关关系,但实际数据显示,这一假设存在显著偏差。Barra CNE5 风险模型的实证结果显示,传统线性模型会系统性高估中盘股的收益(高估幅度约为 15%-20%),同时低估大小盘之间的收益分化程度(低估幅度约为 25%-30%)。

这一偏差的核心原因是,传统线性模型未考虑中盘股的独立风险敞口:中盘股通常处于成长阶段的后期,其风险特征介于小盘股(高成长、高风险)和大盘股(低成长、低风险)之间 ------ 比如中盘股的营收波动率为 25%,而小盘股为 35%,大盘股为 15%。若用线性模型拟合,会将中盘股的收益错误归因于市值规模,而非其自身的风险特征。因此,Barra 模型在 CNE5 版本中引入了 "对数市值立方残差项",在 CNE6 版本中进一步优化为 "市值非线性残差因子",专门分离中盘股的风险敞口,修正线性模型的偏差。

4.3 异质性表现

规模因子的有效性并非在所有样本中均一,而是存在显著的异质性 ------ 这种异质性主要体现在行业属性与企业生命周期两个维度,是由不同标的的风险特征与成长潜力差异决定的。

4.3.1 行业异质性

规模因子的有效性在不同行业存在显著差异:科技成长行业(电子、计算机、机械设备)的有效性显著高于传统行业(金融、消费、公用事业)。国信证券 2025 年的研究报告显示,2023-2024 年小盘行情中,科技成长行业的小市值超额收益达 27%,是金融行业的 3 倍 ------ 金融行业的小市值超额收益仅为 9%。

这一差异的核心原因是行业的成长属性差异:科技成长行业的成长期企业占比达 60%,其盈利增速的波动率为 40%,远高于传统行业的 20%------ 高波动率意味着更高的成长潜力,因此小市值公司的估值溢价更高。而传统行业的成熟期企业占比达 70%,其盈利增速相对稳定,小市值公司的成长空间有限,因此规模因子的有效性较弱。

4.3.2 生命周期异质性

格隆汇 2025 年的现金流分类数据显示,企业生命周期阶段对规模因子的有效性有显著影响:成长期企业的小市值超额收益达 15.6%,成熟期企业仅为 4.2%,衰退期企业为 - 2.1%。

这一差异的核心原因是不同生命周期阶段的风险特征与成长潜力差异:

  • 成长期企业:通常处于新兴行业,营收增速快(年化增速达 30% 以上)、不确定性高,小市值公司的成长空间显著大于大市值公司 ------ 比如成长期的科技公司,其市值可能从 10 亿元增长到 100 亿元,而大市值公司的成长空间相对有限。
  • 成熟期企业:市场份额稳定,盈利增速慢(年化增速约为 5%),市值规模主要由盈利水平决定,而非成长潜力 ------ 比如成熟期的消费公司,其市值主要由净利润规模决定,小市值公司的净利润规模小,因此估值溢价低。
  • 衰退期企业:市场份额萎缩,盈利增速为负,小市值公司的风险更高 ------ 比如衰退期的传统制造公司,其市值可能持续缩水,因此规模因子的有效性为负。

从市场板块来看,科创板的成长期企业占比达 70%,因此规模因子在科创板的有效性显著高于主板 ------2023-2025 年,科创板小市值公司的年化超额收益达 21%,而主板仅为 12%。


第五章 规模因子的存在性机制与争议解析

5.1 风险补偿机制:传统解释

传统资产定价理论认为,规模因子的有效性源于风险补偿 ------ 即小市值公司的系统性风险更高,投资者需要更高的收益率来补偿这些风险。实证数据显示,小市值公司的风险主要体现在流动性风险、财务风险与经营风险三个维度。

5.1.1 流动性风险

小市值公司的流动性风险显著高于大市值公司:2025 年的数据显示,市值低于 50 亿元的公司,日均成交额均值仅为头部公司的 1/23------ 头部公司的日均成交额为 10 亿元,而小市值公司仅为 4300 万元;其中 30% 的小市值公司日均换手率不足 1%,远低于市场平均的 3%。

这一流动性差异的直接后果是,小市值公司的交易成本显著高于大市值公司:根据国泰君安证券的测算,小市值公司的平均买卖价差为 0.8%,而大市值公司仅为 0.2%------ 这意味着,投资者买卖小市值公司的成本是大市值公司的 4 倍。同时,在极端行情下,小市值公司可能面临流动性枯竭的风险:2024 年初,受量化策略集中平仓影响,微盘股指数单日回撤达 8.7%,而同期沪深 300 仅回撤 1.2%------ 部分小市值公司甚至出现 "全天无成交" 的情况,投资者无法及时变现,面临巨大的亏损风险。

5.1.2 财务风险

小市值公司的财务风险也显著高于大市值公司:2025 年的数据显示,中证 2000(小市值指数)、中证 1000(中小盘指数)、沪深 300(大盘指数)的平均 ROE 分别为 1.62%、4.88%、10.09%------ 即市值越小,盈利能力越弱。

从退市风险来看,2023 年 A 股退市公司中,市值低于 50 亿元的占比达 85%------ 这些公司的退市原因主要是财务造假或持续亏损:比如 2023 年退市的 * ST 某公司,其 2022 年净利润亏损达 12 亿元,市值仅为 8 亿元。这意味着,小市值公司的财务造假概率和持续亏损概率更高,投资者面临的本金损失风险更大。

5.1.3 经营风险

小市值公司的经营风险同样显著高于大市值公司:2025 年的数据显示,小市值公司的营收波动率达 35%,是大市值公司的 2.5 倍 ------ 大市值公司的营收波动率仅为 14%。

这一差异的核心原因是,小市值公司的业务集中度更高,对宏观经济波动的敏感性更强:比如小市值的出口型制造公司,其营收可能完全依赖单一海外客户,一旦客户流失,营收将出现大幅下滑;而大市值公司的业务多元化程度更高,能够分散宏观经济波动的风险。2022 年经济下行期的数据显示,小市值公司的净利润同比下滑达 40%,而大市值公司仅下滑 15%------ 这验证了小市值公司的经营风险更高。

5.1.4 风险与收益的相关性

国泰君安证券 2024 年的研究报告显示,小市值公司的综合风险得分(流动性风险 + 财务风险 + 经营风险的加权平均)与规模溢价的 Pearson 相关系数达 0.72,在 1% 的置信水平下显著异于零。这意味着,小市值公司的高收益,本质上是对其高风险的补偿 ------ 投资者承担的风险越高,获得的超额收益也越高,这与传统资产定价理论的 "风险与收益匹配" 逻辑一致。

5.2 投资者行为偏差:行为金融学视角

尽管风险补偿机制能够解释规模因子的部分有效性,但无法解释其在某些阶段的极端表现(如 2013-2015 年创业板牛市中小市值公司的估值泡沫)。行为金融学认为,投资者的行为偏差与有限套利约束,是规模因子长期有效的核心驱动因素。

5.2.1 噪音交易与情绪驱动

A 股市场的散户交易占比长期维持在 60%-70%,交易频率是机构的 3-5 倍 ------ 这意味着,市场中存在大量的 "噪音交易":散户的交易决策并非基于基本面分析,而是基于情绪、谣言或短期价格波动。

小市值公司的散户交易占比更高,达 80%------ 这是因为小市值公司的估值逻辑更复杂,机构覆盖度低:2025 年的数据显示,市值低于 50 亿元的公司中,70% 连续五年未获券商研报覆盖,散户更容易对其估值产生偏差。比如 2023 年 "专精特新" 政策出台后,中证 2000 在 1 个月内涨幅达 15%,但其中仅 30% 的涨幅由基本面驱动,其余均为散户的情绪炒作 ------ 这一现象无法用风险补偿机制解释,只能用行为偏差来解释。

5.2.2 有限套利

套利是纠正资产错误定价的核心机制,但在 A 股市场,套利行为存在显著的约束 ------ 尤其是对于小市值公司而言,套利成本极高。具体约束包括:

  • 卖空限制:小市值公司的融券成本显著高于大市值公司,融券利率达 8%-10%,是大市值公司的 3 倍 ------ 这意味着,机构若要通过卖空小市值公司来纠正定价偏差,需要承担更高的成本,甚至可能出现 "套利亏损" 的情况。
  • 流动性约束:小市值公司的日均成交额低,机构难以建立足够的套利仓位 ------ 比如一只市值 10 亿元的小市值公司,日均成交额仅为 1000 万元,机构若要建立 10% 的仓位,需要 10 个交易日才能完成,而此时价格可能已经发生变化,套利空间消失。

这些约束导致小市值公司的错误定价无法被及时纠正,规模溢价得以长期存在。比如 2015 年创业板牛市期间,部分小市值公司的 PE 达 100 倍以上,远高于其基本面支撑的 20 倍,但机构无法通过卖空来纠正这一偏差,导致泡沫持续膨胀。

5.2.3 处置效应与羊群效应

行为金融学的经典偏差 ------ 处置效应与羊群效应,也会放大规模因子的表现:

  • 处置效应:投资者倾向于过早卖出盈利的股票,过久持有亏损的股票。对于小市值公司而言,其价格波动更大,投资者更容易出现 "赚了就卖、亏了就扛" 的行为 ------ 这会导致小市值公司的价格在上涨阶段被低估,在下跌阶段被高估,进一步放大其收益率波动。
  • 羊群效应:投资者倾向于跟随市场情绪行动。当小盘风格占优时,投资者会集体买入小市值公司,导致其价格快速上涨;当大盘风格占优时,投资者会集体卖出小市值公司,导致其价格快速下跌 ------ 这会放大规模因子的周期性表现,比如 2023-2025 年的小盘行情中,中证 2000 的涨幅达 40%,而同期沪深 300 仅上涨 10%。

5.3 关于规模因子的争议

尽管规模因子是资产定价理论的基石之一,但学界与业界对其有效性与冗余性仍存在显著争议 ------ 这些争议主要集中在两个维度:一是规模因子在某些阶段的失效原因,二是其在五因子模型中的冗余性。

5.3.1 失效与稳定性的争议

规模因子的有效性并非持续稳定 ------ 比如 2011-2019 年,A 股规模因子出现了两次显著的失效期:2003-2006 年、2017-2021 年。部分学者(如 Linnainmaa and Roberts 2018)认为,规模因子的有效性是 "数据挖掘" 的结果,即研究者通过对历史数据的过度拟合,发现了一个虚假的规律;但多数实证研究(如 Fama and French 2015、国泰君安 2024 年研报)认为,规模因子的失效是阶段性的,与宏观经济周期、政策环境、市场结构变化相关。

具体到 A 股 2011-2019 年的失效期,其核心原因包括:①供给侧改革推动大市值周期股的盈利修复,2016-2018 年,钢铁、煤炭等周期行业的大市值公司净利润增速达 40% 以上,而小市值公司仅为 10% 左右;②北向资金大规模流入,其持仓偏好集中在大市值消费、金融标的,2017-2019 年北向资金累计净流入超 8000 亿元,占同期 A 股总成交额的 3% 左右;③2012 年主板退市新规的出台,导致小市值公司的壳价值从平均 20 亿元降至 5 亿元以下。这些因素共同导致了规模因子的阶段性失效,但并非其本身的有效性消失。

5.3.2 五因子模型中的冗余性争议

2015 年 Fama-French 五因子模型提出后,学界对规模因子的冗余性存在争议:Fama 和 French(2015)在美股市场的实证结果显示,价值因子(HML)可能冗余 ------ 即五因子模型中,HML 的解释力可以被盈利因子(RMW)和投资因子(CMA)替代;但规模因子(SMB)的解释力并未被替代,仍然是核心定价因子。

但 A 股市场的实证结果与美股相反:云南高校图书馆联盟 2026 年的研究显示,三因子模型对 A 股收益的解释力达 78%,而五因子模型仅为 62%------ 这意味着,RMW 和 CMA 因子在 A 股市场的有效性较弱,规模因子的核心地位并未动摇。这一差异的核心原因是,A 股市场的投资者结构与美股不同:A 股的散户占比高,定价偏差大,而美股的机构占比高,定价效率高。因此,五因子模型的解释力存在显著的跨市场差异,规模因子在 A 股市场无冗余性。


第六章 规模因子在投资实践中的应用

6.1 纯规模因子策略(SMB)

纯规模因子策略,是指仅通过做多小市值股票、做空大市值股票来获取超额收益的多空策略 ------ 这是规模因子最直接的应用形式。

6.1.1 策略构造

纯规模因子策略的构造逻辑,严格遵循 Fama-French 的经典框架,但在 A 股市场需做适应性调整:

  • 排序指标:通常采用总市值或自由流通市值 ------ 总市值反映公司的整体规模,自由流通市值反映公司的可交易规模,两者的差异会影响分组结果:比如部分公司的总市值大,但自由流通市值小,其流动性可能更接近小市值公司。
  • 分组规则:按市值分位数分为小盘组合(如市值后 20%)和大盘组合(如市值前 20%)------ 分组比例越极端,策略的超额收益越高,但风险也越大:比如市值后 10% 的组合,年化收益率比后 20% 的组合高 5 个百分点,但最大回撤也高 10 个百分点。
  • 调仓频率:通常为年度调仓(每年 6 月末排序,7 月调仓),以平衡交易成本与时效性 ------ 若调仓频率过高,交易成本会侵蚀超额收益;若调仓频率过低,因子暴露度会随市值变化而下降。
  • 权重配置:等权或流通市值加权 ------ 等权配置能更充分暴露小市值敞口,超额收益更高,但风险也更大;流通市值加权更贴合市场实际,风险更低,但超额收益也更低。
6.1.2 风险收益特征

2004-2025 年,A 股纯规模因子策略的年化收益率达 4.2%,夏普比率 0.46,显著优于同期沪深 300 的 0.36。但该策略的风险也较为显著:

  • 极端回撤风险:2008 年金融危机期间,策略回撤达 35.2%;2016 年熔断期间,策略回撤达 42.7%------ 这是因为小市值公司的流动性风险在极端行情下会集中爆发,导致收益率大幅下跌。
  • 阶段性失效风险:2011-2019 年,策略年化收益率为 - 1.2%------ 这与当时供给侧改革推动的大盘蓝筹估值修复直接相关,大市值周期股的盈利增速显著高于小市值公司。

为验证这一策略的稳健性,海通证券 2019 年的《选股因子系列研究 (四十八)》回测了 2009-2018 年的数据,结果显示纯 SMB 因子策略的年化超额收益达 4.2%,后验概率达 47.81%------ 这意味着,该策略的超额收益并非偶然,而是具备统计显著性。

6.2 多因子组合中的规模因子

在实际投资中,纯规模因子策略的风险较高,因此机构通常会将规模因子与其他因子(如价值、质量、低波动因子)结合,构建多因子组合 ------ 这既能保留规模因子的超额收益,又能分散单一因子的风险。

6.2.1 行业中性化规模因子策略

行业中性化是多因子策略中最常用的风险控制手段 ------ 其核心逻辑是,在计算因子暴露度时,控制行业的影响,避免行业配置偏差对因子收益的干扰。具体而言,行业中性化的规模因子策略,是指在每个行业内,按市值规模排序,选取小市值股票构建组合,而非在全市场范围内排序。

华安证券 2025 年的研究报告显示,行业中性化后的规模因子策略,在中证 1000 增强组合中实现年化超额收益 13%,信息比率达 1.67------ 这一结果显著优于未中性化的策略(年化超额收益 8%,信息比率 1.2)。这是因为,行业中性化剥离了行业轮动的干扰,使策略的收益更纯粹来自市值规模差异,而非行业配置的运气。

例如,2023 年科技行业行情中,未中性化的规模因子策略的超额收益中,有 40% 来自科技行业的配置,而行业中性化后的策略,这一比例仅为 10%------ 这意味着,行业中性化后的策略,其超额收益更稳定,受行业轮动的影响更小。

6.2.2 与价值、动量等因子的融合

机构通常会将规模因子与价值、质量、低波动等因子融合,构建复合因子策略 ------ 这既能分散单一因子的风险,又能提升策略的风险调整后收益。常见的复合因子策略包括:

  • 价值 + 规模:选取低估值(如低 PE/PB)的小市值股票 ------ 这一策略能过滤掉估值过高的小市值泡沫股,比如 2015 年创业板牛市期间,价值 + 规模策略的最大回撤比纯规模策略低 15 个百分点。
  • 质量 + 规模:选取高 ROE、高现金流的小市值股票 ------ 这一策略能过滤掉财务风险高的小市值公司,比如 2022 年经济下行期,质量 + 规模策略的年化收益率比纯规模策略高 8 个百分点。
  • 低波动 + 规模:选取低波动率的小市值股票 ------ 这一策略能降低小市值公司的极端风险,比如 2016 年熔断期间,低波动 + 规模策略的最大回撤比纯规模策略低 20 个百分点。

长江证券 2025 年的研究报告显示,复合因子策略的年化收益率达 13.6%,夏普比率达 0.8------ 这一结果显著优于纯规模策略的 0.46,验证了多因子融合的有效性。

6.3 因子择时与风格轮动

规模因子的表现具有显著的周期性,因此因子择时是提升策略收益的关键 ------ 通过识别市场环境的变化,动态调整规模因子的暴露度,能够在保留超额收益的同时,降低策略的回撤风险。

6.3.1 择时信号

华泰证券 2025 年的市值因子择时模型,识别了两类核心择时信号:

  • 宏观变量信号:包括经济增长维度(工业生产、出口)和流动性维度(M2、社融)。其中,M2 增速与规模因子收益率的相关系数达 0.6------ 当 M2 增速超过 10% 时,规模因子的胜率达 75%,年化收益率达 12%;当 M2 增速低于 8% 时,规模因子的胜率仅为 30%,年化收益率为 - 2%。这是因为,宽松的流动性环境下,资金更倾向于流向估值弹性更高的小市值公司;而紧缩的流动性环境下,资金更倾向于流向流动性好、盈利稳定的大市值公司。
  • 量价信号:包括市值因子自身的趋势(如双均线系统)和市场拥挤度(如小市值股票的换手率)。当小市值股票的换手率超过 30% 时,规模因子的未来收益率为负的概率达 80%------ 这是因为,换手率过高意味着市场情绪过热,小市值公司的估值泡沫即将破裂。
6.3.2 轮动策略

基于择时信号,机构通常会构建大小盘风格轮动策略 ------ 即根据市场环境的变化,在小盘组合与大盘组合之间动态切换仓位。华泰证券的市值因子择时模型,回测 2004-2025 年的数据显示,该策略的年化收益率达 12.7%,夏普比率达 0.7,最大回撤达 28.3%------ 这一结果显著优于纯规模策略的 4.2% 和 0.46。

具体的轮动规则包括:

  • 当流动性宽松(M2 增速 > 10%)且市场拥挤度低(小市值换手率 < 20%)时:超配小盘组合,仓位占比达 80%------ 这是规模因子的最优收益区间,此时小市值公司的估值弹性最大,超额收益最高。
  • 当流动性紧缩(M2 增速 <8%)且市场拥挤度高(小市值换手率> 30%)时:超配大盘组合,仓位占比达 80%------ 这是规模因子的风险区间,此时小市值公司的流动性风险和估值泡沫风险最大,需要规避。
  • 当流动性中性(M2 增速 8%-10%)且市场拥挤度中等(小市值换手率 20%-30%)时:均衡配置小盘与大盘组合,仓位各占 50%------ 这是市场的过渡区间,规模因子的有效性较弱,需要分散风险。

6.4 风险管理

规模因子的高收益伴随高风险,因此风险管理是策略应用的核心 ------ 机构通常会采用事前、事中、事后三层风控体系,将风险控制在可承受范围内。

6.4.1 风险识别

规模因子的风险主要包括三类:

  • 特异性风险:小市值公司自身的经营风险、财务风险 ------ 比如小市值公司的产品研发失败、核心客户流失等,这类风险无法通过分散投资完全消除,但可以通过筛选高 ROE、高现金流的标的来降低。
  • 系统性风险:市场整体下跌导致的风险 ------ 比如 2008 年金融危机、2020 年新冠疫情等,这类风险可以通过对冲(如做空沪深 300 股指期货)来规避,但会增加策略成本。
  • 风格轮动风险:市场风格从小盘切换到大盘导致的风险 ------ 比如 2017-2019 年的大盘蓝筹行情,这类风险可以通过因子择时来规避,但需要准确识别市场环境的变化。
6.4.2 控制措施

为控制规模因子的风险,机构通常会采用以下措施:

  • 市值分层:限制对微盘股(市值后 5%)的暴露 ------ 微盘股的流动性风险和财务风险过高,2025 年的数据显示,微盘股的年化波动率达 35%,而小盘股仅为 28%;限制微盘股的暴露,能将策略的最大回撤降低约 10 个百分点。
  • 行业中性化:确保组合的行业分布与基准指数一致 ------ 这能避免行业配置偏差带来的风险,比如 2023 年科技行业行情中,行业中性化的策略,其超额收益更稳定,受行业轮动的影响更小。
  • 动态敞口控制:设定单因子暴露上限 ------ 比如某因子的风险贡献度不超过组合总风险的 20%,当规模因子的暴露度超过上限时,自动调整仓位,将暴露度降至上限以下。
  • 止损阈值:设定止损线 ------ 比如当策略的回撤超过 10% 时,自动减仓至 50%;当回撤超过 20% 时,自动清仓 ------ 这能有效控制极端风险,避免大幅亏损。

例如,2024 年初流动性枯竭事件中,某头部量化机构将规模因子的敞口上限从 20% 降至 10%,使组合的最大回撤从 28% 降至 12%------ 这验证了动态敞口控制的有效性。


第七章 规模因子与其他因子的对比分析

7.1 与价值因子(HML)的对比

价值因子(HML)是另一个核心定价因子,其逻辑是 "高账面市值比(B/M)的公司收益率显著高于低 B/M 的公司"。规模因子与价值因子的对比,能清晰展现两者的收益来源与风险特征差异。

7.1.1 收益来源差异
  • 规模因子:收益主要来自流动性风险溢价与投资者行为偏差 ------ 小市值公司的流动性差、风险高,投资者需要更高的收益来补偿;同时,散户的噪音交易放大了小市值公司的定价偏差,导致其估值溢价长期存在。
  • 价值因子:收益主要来自财务风险溢价与均值回归 ------ 高 B/M 的公司通常是盈利不佳的 "价值股",其财务风险高,投资者需要更高的收益来补偿;同时,市场对价值股的估值通常会回归合理水平,导致其收益率上升。
7.1.2 相关性与互补性

规模因子与价值因子的相关性较低 ------Pearson 相关系数约为 0.3,在 1% 的置信水平下显著异于零。这意味着,两者的收益来源不同,具备显著的互补性:

  • 在小盘风格占优时:规模因子的年化收益率达 15.6%,而价值因子的年化收益率仅为 5.2%------ 这是因为,小盘风格占优时,市场更关注成长潜力,而非当前的盈利水平。
  • 在价值风格占优时:价值因子的年化收益率达 12.3%,而规模因子的年化收益率仅为 3.1%------ 这是因为,价值风格占优时,市场更关注当前的盈利水平,而非成长潜力。

因此,将规模因子与价值因子结合,能有效分散风险,提升策略的风险调整后收益。比如,价值 + 规模策略的年化收益率达 10.2%,夏普比率达 0.6,显著优于纯规模策略的 4.2% 和 0.46。

7.2 与动量因子(MOM)的对比

动量因子(MOM)的逻辑是 "过去 12 个月收益率高的公司,未来 1 个月的收益率仍会高于过去 12 个月收益率低的公司"。规模因子与动量因子的对比,能展现两者的市场状态依赖性差异。

7.2.1 收益特征差异
  • 规模因子:在宽松流动性周期胜率高(达 75%),年化收益率达 12%------ 这是因为,宽松的流动性环境下,资金更倾向于流向估值弹性更高的小市值公司。
  • 动量因子:在趋势市胜率高(达 65%),年化收益率达 15.8%;但在震荡市胜率低(仅为 30%),年化收益率为 - 9.3%------ 这是因为,趋势市中,价格趋势会持续;而震荡市中,价格趋势会反转。
7.2.2 相关性与互补性

规模因子与动量因子的相关性较低 ------Pearson 相关系数约为 0.2,在 1% 的置信水平下显著异于零。这意味着,两者的收益来源不同,具备显著的互补性:

  • 在趋势性上涨市场中:动量因子的年化收益率达 15.8%,而规模因子的年化收益率仅为 8.7%------ 这是因为,趋势性上涨市场中,价格趋势会持续,动量因子的收益更高。
  • 在震荡上涨市场中:规模因子的年化收益率达 9.1%,而动量因子的年化收益率仅为 2.3%------ 这是因为,震荡上涨市场中,价格趋势不持续,动量因子的收益低,而小市值公司的估值弹性更高。

因此,将规模因子与动量因子结合,能有效提升策略在不同市场环境下的适应性。比如,动量 + 规模策略的年化收益率达 11.2%,夏普比率达 0.65,显著优于纯规模策略的 4.2% 和 0.46。

7.3 与质量因子(Quality)的对比

质量因子的逻辑是 "盈利能力强、现金流稳定的公司收益率显著高于盈利能力弱、现金流不稳定的公司"。规模因子与质量因子的对比,能展现两者的风险收益平衡差异。

7.3.1 收益特征差异
  • 规模因子:收益高,但风险也高 ------ 年化收益率达 4.2%,年化波动率达 28%,最大回撤达 72%------ 这是因为,小市值公司的流动性风险和财务风险高。
  • 质量因子:收益低,但风险也低 ------ 年化收益率达 8%,年化波动率达 18%,最大回撤达 35%------ 这是因为,高质量公司的盈利能力强、现金流稳定,风险低。
7.3.2 相关性与互补性

规模因子与质量因子的相关性较低 ------Pearson 相关系数约为 0.1,在 1% 的置信水平下显著异于零。这意味着,两者的收益来源不同,具备显著的互补性:

  • 质量因子能平滑规模因子的波动:将质量因子与规模因子结合,能将策略的年化波动率从 28% 降至 20%,最大回撤从 72% 降至 45%------ 这是因为,高质量公司的盈利稳定,能抵消小市值公司的部分风险。
  • 规模因子能提升质量因子的收益:将规模因子与质量因子结合,能将策略的年化收益率从 8% 升至 10%------ 这是因为,小市值公司的成长潜力,能提升高质量公司的收益空间。

因此,质量 + 规模策略是机构常用的稳健型策略,既能保留规模因子的超额收益,又能降低其风险。

7.4 与低波动因子(Low Vol)的对比

低波动因子的逻辑是 "波动率低的公司收益率显著高于波动率高的公司"。规模因子与低波动因子的对比,能展现两者的市场状态依赖性差异。

7.4.1 收益特征差异
  • 规模因子:在牛市表现好 ------ 年化收益率达 15.6%,这是因为,牛市中市场风险偏好上升,投资者更倾向于配置高弹性的小市值公司。
  • 低波动因子:在熊市表现好 ------ 年化收益率达 10.2%,这是因为,熊市中市场风险偏好下降,投资者更倾向于配置低波动的公司,以规避风险。
7.4.2 相关性与互补性

规模因子与低波动因子的相关性为负 ------Pearson 相关系数约为 - 0.4,在 1% 的置信水平下显著异于零。这意味着,两者的收益来源完全相反,具备显著的互补性:

  • 在牛市中:规模因子的年化收益率达 15.6%,而低波动因子的年化收益率仅为 3.1%------ 这是因为,牛市中市场风险偏好上升,投资者更倾向于配置高弹性的小市值公司,而非低波动的公司。
  • 在熊市中:低波动因子的年化收益率达 10.2%,而规模因子的年化收益率仅为 - 2.1%------ 这是因为,熊市中市场风险偏好下降,投资者更倾向于配置低波动的公司,以规避风险,而小市值公司的风险更高,收益率更低。

因此,将规模因子与低波动因子结合,能有效对冲熊市风险,提升策略的抗跌性。比如,低波动 + 规模策略的年化收益率达 9.1%,夏普比率达 0.6,最大回撤达 40%,显著优于纯规模策略的 72% 最大回撤。

7.5 因子合成与正交化

因子合成与正交化,是多因子模型中提升解释力的关键技术 ------ 其核心目的是剥离因子之间的信息重叠,获取纯因子的收益。

7.5.1 信息重叠的识别

因子之间的信息重叠,是指不同因子的收益来源存在部分重合。常见的信息重叠包括:

  • 规模因子与价值因子:相关系数约为 0.3------ 小市值公司的 B/M 通常较高,因为其盈利水平低,账面市值比高。
  • 规模因子与流动性因子:相关系数约为 0.5------ 小市值公司的流动性通常较差,因为其日均成交额低。

信息重叠会导致多因子模型的参数不稳定,高估组合的风险敞口。根据中信证券 2021 年的研究,当两个因子的信息重叠度超过 60% 时,模型会高估组合风险敞口约 20%------ 这会导致策略的风险调整后收益被虚增,实际投资中容易出现亏损。

7.5.2 正交化处理的效果

因子正交化,是指通过线性回归等方法,剥离因子之间的信息重叠,获取纯因子的收益。天相投顾 2025 年的研究显示,对 2020-2024 年的 9 个一级因子进行正交化处理后,规模因子的相关性从 0.5 升至 0.99------ 这意味着,正交化处理有效剥离了其他因子的干扰,获取了纯规模因子的收益。

具体而言,正交化处理的步骤包括:

  1. 对每个因子进行线性回归,以其他因子为自变量,该因子为因变量。
  2. 取回归的残差项,作为正交化后的纯因子。

正交化处理后的规模因子,其收益更纯粹,风险调整后收益更高 ------ 天相投顾的研究显示,正交化后的规模因子,年化收益率达 5.2%,夏普比率达 0.5,显著优于处理前的 4.2% 和 0.46。


第八章 规模因子的未来展望

8.1 注册制全面推行的影响

2023 年注册制全面推行,是 A 股市场的结构性变革 ------ 这一变革将从根本上改变小市值公司的供给与估值逻辑,对规模因子的有效性产生深远影响。

8.1.1 小市值公司供给增加

注册制全面推行后,A 股上市公司数量从 2023 年的 4800 家增至 2025 年的 5413 家,其中市值低于 50 亿元的公司占比从 2023 年的 25% 升至 2025 年的 33.96%。这一变化的核心影响是,小市值公司的稀缺性显著下降,其估值溢价将逐步收窄:

  • 壳价值消失:注册制下,企业上市变得更加容易,IPO 排队期从原来的 3 年缩短至 6 个月,借壳上市的需求锐减了 90% 以上 ------ 空壳公司的估值较注册制前平均缩水 70% 以上,小市值公司的 "壳价值" 溢价基本消失。
  • 估值分化加剧:小市值公司将出现明显的估值分化 ------ 具备核心技术、盈利稳定的 "优质小盘股"(如专精特新企业),其估值溢价将维持甚至提升;而缺乏核心竞争力、盈利不稳定的 "垃圾小盘股",其估值将持续缩水,甚至面临退市风险。
8.1.2 有效性向优质小盘股集中

注册制下,规模因子的有效性将向市值 50-200 亿元的 "优质小盘股" 集中 ------ 这类标的既具备一定的成长空间,又拥有相对完善的治理结构和流动性。中金公司 2025 年的研究报告显示,市值 50-200 亿元的公司,年化超额收益达 8.7%,而市值低于 50 亿元的公司,年化超额收益仅为 3.2%------ 这意味着,规模因子的有效性不再是 "越小越好",而是 "优质优先"。

这一变化的核心驱动因素是,注册制下,投资者更关注公司的基本面,而非单纯的市值规模 ------ 机构持股占比从 2023 年的 40% 升至 2025 年的 45%,机构更倾向于配置优质小盘股,推动其估值溢价逐步提升。

8.2 机构化进程的加速

A 股机构化进程正在加速 ------ 这一进程将从根本上改变市场的定价逻辑,对规模因子的有效性产生深远影响。

8.2.1 机构持股占比提升

2025 年的数据显示,A 股机构投资者持股市值占比达 45%,较 2004 年的 20% 提升了 25 个百分点 ------ 其中,公募基金、保险资金、北向资金是机构持股的核心力量:公募基金持股市值占比达 14.89%,保险资金占比达 3.8%,北向资金占比达 3.8%。

机构持股占比的提升,将从两个方面影响规模因子的有效性:

  • 定价效率提升:机构更倾向于基本面分析,而非情绪驱动 ------ 机构的研究覆盖度更高,对小市值公司的估值偏差会被逐步纠正,规模溢价将逐步收窄。比如,2025 年的数据显示,机构覆盖度高的小市值公司,其估值溢价比覆盖度低的公司低约 15%。
  • 优质小盘股溢价提升:机构更倾向于配置市值 50-200 亿元的优质小盘股 ------ 这类标的既具备成长空间,又拥有完善的治理结构和流动性,其估值溢价将逐步提升,推动规模因子的有效性向这类标的集中。
8.2.2 定价效率的提升

机构化进程的加速,将提升 A 股市场的定价效率 ------ 这意味着,小市值公司的定价偏差会被逐步纠正,规模溢价将逐步收窄。长江证券 2025 年的研究报告显示,2025 年小市值公司的定价偏差(实际价格与基本面价值的差异)较 2004 年缩小了约 30%------ 这意味着,规模因子的有效性将逐步减弱,但不会消失。

这是因为,机构化进程是一个长期的过程,A 股的散户交易占比仍维持在 60%-70%,噪音交易仍会存在 ------ 小市值公司的定价偏差仍会存在,只是幅度会更小。因此,规模因子的有效性将逐步减弱,但仍会是 A 股市场的核心定价因子之一。

8.3 AI 量化交易的冲击

AI 量化交易的快速发展,是 A 股市场的新趋势 ------ 这一趋势将从根本上改变市场的交易逻辑,对规模因子的有效性产生深远影响。

8.3.1 量化交易占比提升

2025 年的数据显示,A 股量化交易的成交占比达 20%-30%,其中中小盘股的量化交易占比达 50%------ 这意味着,中小盘股的短期价格波动和流动性,很大程度上由量化策略驱动。

量化交易的核心优势是,能够快速识别和利用小市值公司的定价偏差 ------ 比如,量化策略可以通过挖掘另类数据(如专利文本、产业链动态),提前识别小市值公司的成长潜力,获取超额收益。头部量化机构(如幻方、九坤)通过机器学习优化因子模型,在中小盘指增策略中实现了年化超额收益 16.75%------ 这一结果显著优于传统主动管理策略。

8.3.2 策略拥挤度的变化

随着量化资金的涌入,规模因子的策略拥挤度正在逐步提升。华泰证券 2025 年的研究报告显示,2025 年规模因子的策略拥挤度(量化资金在小市值公司的持仓占比)达 25%,较 2020 年提升了 15 个百分点 ------ 这意味着,规模因子的超额收益将逐步收窄。

具体而言,策略拥挤度的提升,将导致规模因子的年化收益率从 2020 年的 9.1% 降至 2025 年的 4.2%------ 这是因为,量化资金的涌入,会快速纠正小市值公司的定价偏差,导致超额收益逐步收窄。但需要注意的是,量化策略的容量有限 ------ 当量化资金的规模超过小市值公司的流动性承载能力时,策略的超额收益会出现边际递减,但不会消失。

8.4 ESG 与规模因子的结合

ESG(环境、社会、治理)投资是全球资产管理行业的趋势 ------ 这一趋势将与规模因子结合,形成新的投资策略,提升规模因子的风险调整后收益。

8.4.1 ESG 因子与规模因子的相关性

易方达基金 2025 年的研究报告显示,A 股市场中,ESG 因子与规模因子呈显著负相关 ------Pearson 相关系数约为 - 0.4,在 1% 的置信水平下显著异于零。这意味着,大市值公司的 ESG 评分通常更高,小市值公司的 ESG 评分通常更低 ------ 这是因为,大市值公司的治理结构更完善,更注重环境和社会责任,而小市值公司的治理结构相对不完善,更关注短期盈利。

8.4.2 ESG 整合的效果

尽管小市值公司的 ESG 评分通常更低,但将 ESG 因子与规模因子结合,能显著提升策略的风险调整后收益。原创力文档 2025 年的研究报告显示,加入 ESG 因子后,规模因子的夏普比率提升 0.15-0.25,最大回撤降低 8-12 个百分点 ------ 这是因为,ESG 因子能过滤掉 ESG 评分低的小市值公司,这类公司的财务风险和经营风险更高,容易出现亏损。

具体而言,ESG 整合的策略包括:

  • 筛选高 ESG 评分的小市值公司:选取 ESG 评分前 20% 的小市值公司,构建组合 ------ 这类公司的治理结构更完善,盈利更稳定,风险更低。
  • 将 ESG 评分作为因子权重:在多因子模型中,将 ESG 评分作为权重,提升高 ESG 评分小市值公司的权重 ------ 这能进一步提升策略的风险调整后收益。

例如,易方达基金 2025 年的 ESG + 规模策略,年化收益率达 5.2%,夏普比率达 0.5,最大回撤达 55%------ 这一结果显著优于纯规模策略的 4.2% 和 0.46。


第九章 结论

规模因子作为资产定价理论的核心因子之一,其有效性与特征在 A 股市场呈现出显著的独特性 ------ 这种独特性,是由 A 股的市场结构、投资者行为与政策环境共同决定的。基于 1926-2025 年的跨市场长周期数据,本报告得出以下核心结论:

  1. 长周期有效性显著,但呈现非线性特征:A 股市场 2004-2025 年的规模因子(SMB)年化多空收益达 4.2%,风险调整后收益(夏普比率 0.46)显著优于市场基准;但规模效应并非均匀分布,存在约 50 亿元的 "市值临界点"------ 低于该值的标的超额收益显著更高,超过则溢价快速收窄。传统线性模型因忽略这一特征,会系统性高估中盘股收益、低估大小盘分化程度,这也解释了为何 Barra 等机构模型需要对规模因子做非线性修正。
  2. 表现具有强状态依赖性:规模因子的有效性与市场周期、行业属性强相关 ------ 宽松流动性周期胜率达 75%,科技成长行业超额收益是金融行业的 3 倍;2011-2019 年曾因供给侧改革、北向资金流入等因素阶段性失效。这种状态依赖性,本质是规模因子的收益来源(风险补偿 + 行为偏差)与市场环境的匹配程度决定的:当市场环境有利于风险偏好提升或噪音交易活跃时,规模因子的有效性更强;反之则更弱。
  3. 有效性由风险补偿与行为偏差共同驱动:小市值公司的流动性、财务风险更高,需风险溢价覆盖 ------2025 年数据显示,市值低于 50 亿元的公司,日均成交额仅为头部公司的 1/23,平均 ROE 仅为 1.62%;同时,散户主导的噪音交易放大定价偏差,有限套利约束(融券成本是大市值公司的 3 倍)维持溢价长期存在。这两种机制的叠加,是规模因子在 A 股长期有效的核心原因。
  4. 应用需结合风险控制与因子择时:纯规模因子策略风险较高(最大回撤达 72%),需通过行业中性化、复合因子融合、动态敞口控制等手段降低风险;因子择时能显著提升收益 ------ 华泰证券的择时模型回测显示,该策略的年化收益率达 12.7%,夏普比率达 0.7,显著优于纯规模策略。这意味着,规模因子的应用,本质是在 "收益" 与 "风险" 之间寻找平衡,而非单纯追求高收益。
  5. 未来有效性将向优质小盘股集中:注册制扩容将降低小市值公司的稀缺性,机构化进程将提升定价效率,AI 量化交易将收窄超额收益 ------ 这些趋势共同决定,规模因子的有效性将不再是 "越小越好",而是 "优质优先"。同时,ESG 与规模因子的结合,将成为未来的重要发展方向,能显著提升策略的风险调整后收益。

综上所述,规模因子在 A 股市场仍将是核心定价因子之一,但需摒弃 "越小越好" 的传统观念,转向 "优质小盘股" 的精细化筛选 ------ 这需要投资者结合基本面分析、因子择时与风险管理,才能在获取超额收益的同时,控制极端风险。

相关推荐
陆业聪1 小时前
架构哲学与工程化:从开发体验到CI/CD的全维度对比|跨平台框架深度对决(三)
人工智能·aigc
朝新_1 小时前
【LangChain】少样本提示(few-shorting) 大模型 Few-Shot 提示工程:四大 Example Selector应用
java·人工智能·自然语言处理·langchain
Soonyang Zhang1 小时前
vllm分析(二)——http request的入口处理
人工智能·vllm·推理框架
风儿吟1 小时前
【论文速递】【高被引论文】ECG-ADGAN:基于时序生成对抗网络的心电异常检测新范式,多项指标超越现有SOTA。
人工智能·神经网络·生成对抗网络
Vol火山1 小时前
灵魂的躯体:论企业架构(EA)与 Palantir 本体论在 AI 时代的深度融合
人工智能·架构
这张生成的图像能检测吗2 小时前
(论文速读)基于优化的YOLO-BFP和RIoU度量学习的动态尺度感知车辆再识别
人工智能·计算机视觉·目标跟踪
CodePlayer竟然被占用了2 小时前
当 AI Agent 开始"做梦":深度解析 Claude Managed Agents 的 Dreaming 机制
人工智能
道可云2 小时前
道可云人工智能&OPC每日资讯|宁波发布”AI+制造”三年行动方案,打造全场景开放创新高地
人工智能·制造
赴山海bi2 小时前
亚马逊DeepBI广告结构优化策略:实现高效增长与成本控制
人工智能·搜索引擎