前言
在第7篇文章中指出,量化交易的主要有两方面应用,基于的数据主要是两个类型,如前面讲的用之前的数据预测股价,这类数据我们可归为纵向研究数据,又称时间序列数据,另一类是横截面数据,以称截面数据,即在一个时间节点上的数据。现在量化平台的因子分析,都是基于截面数据做分析和研究。从广义上讲,其实还有一种数据类型,面板数据,综合了截面数据和时间序列两个维度,不局限于股票,如CPI数据,各种工业指数等。
在量化投资中最重要的三大理论为:资产定价理论、投资组合理论以及市场有效假说理论。而资产定价理论是现在量化交易的基础,现在流行的多因子模型是在此基础上发展起来的。
过多的理论的东西,只做初步的介绍,让小伙伴有所了解量化投资的底层逻辑,如果看不懂,可以跳过。
量化投资主要理论
- 资本资产定价模型CAPM
- 套利定价理论APT
- Fama_French三因子模型
- 多因子模型
资本资产定价模型CAPM
资本资产定价模型(Capital Asset Pricing Model 简称CAPM)即市场资产预期收益率与风险资产之间关系及均衡价格形成的一种资本成本估价方法。
对于一个给定的资产i,它的期望收益率和市场投资组合的期望收益率之间的关系可以表示为:
E ( r i ) = r f + β i m [ E ( r m ) − r f ] E(r_i)=r_f + \beta_{im}[E(r_m)-r_f] E(ri)=rf+βim[E(rm)−rf]
E ( r i ) E(r_i) E(ri)是资产i的期望收益率
r f r_f rf 是无风险收益率,通常以短期国债的利率来近似替代;
β i m \beta_{im} βim:(Beta)是资产 i的系统性风险系数,其中 β = C o v ( r i , r m ) V a r ( r m ) \beta=\frac{Cov(r_i,r_m)}{Var(r_m)} β=Var(rm)Cov(ri,rm)
E ( r m ) E(r_m) E(rm)是市场投资组合 m m m 的期望收益率,通常用股票价格指数收益率的平均值或所有股票的平均收益率来代替;
E ( r m ) − r f E(r_m) − r_f E(rm)−rf 是市场风险溢价(Market Risk Premium),即市场投资组合的期望收益率与无风险收益率之差。
E E E 是期望,去掉后再画成图如下。
上图是理论情况,而实际情况是有误差项,即
r i = α + r f + β ( r m − r f ) r_i=\alpha+r_f+\beta(r_m-rf) ri=α+rf+β(rm−rf)
这里的 α \alpha α (Alpha)是指资产收益率在风险之外有了脱离了风险的"额外收益 "。
β \beta β (Beta)为资产风险程度。
- 如果 Alpha = 0,这意味着该资产的表现几乎符合预期,已获得与风险相称的回报。
- 如果 Alpha > 0,这意味着它的表现优于市场。Alpha 值为 5 表示该资产的表现优于基准的5%
- 如果 Alpha <0 这意味着它表现不佳。Alpha 值为 -2 意味着该工具的表现比基准低 2%。
如你所见,高 Alpha 总是好的。它衡量相关股票、证券或投资组合的风险调整后的表现。
而 Beta 会告诉我们资产显示相对于所选基准的固有风险。
- 如果Beta = 1,则该工具的波动性与与之比较的基准相同。
- 如果Beta >1,则该工具本质上更具波动性。
- 如果Beta <1或接近于 0,则该工具的波动性较小。
· 我们也可以使用负 Beta 值,其中回报与基准的回报呈负相关。
比如,在股市表现良好的时期,高 Beta 股票往往会跑赢大盘。同样,当股市表现不佳时,低 Beta 股票往往会跑赢大盘(因为它们下跌的幅度较小)。
套利定价理论APT
套利定价理论(Arbitrage Pricing Theory , APT)以收益率形成过程的多因子模型为基础,认为证券收益率与一组因子线性相关,这组因子代表证券收益率的一些基本因素。事实上,当收益率通过单一因子(市场组合)形成时,将会发现套利定价理论形成了一种与资本资产定价模型相同的关系。因此,套利定价理论可以被认为是一种广义的资本资产定价模型,为投资者提供了一种替代性的方法,来理解市场中的风险与收益率间的均衡关系。
r i = a + β 1 F 1 + β 2 F 2 + β 3 F 3 + . . . + β k F k + ϵ i r_i=a+\beta_1F_1+\beta_2F_2+\beta_3F_3+...+\beta_kF_k+\epsilon_i ri=a+β1F1+β2F2+β3F3+...+βkFk+ϵi
矩阵表示
r = a + B ∗ F + ϵ r=a+B*F+\epsilon r=a+B∗F+ϵ
r r r 是N个资产收益率组成的列向量;
a a a 是常数组成的列向量;
B B B 是N*K的矩阵,代表因素K 对不同资产的暴露;
F F F 是因子收益率的列向量。
Fama_French三因子模型
三因子模型 超额回报率由三个因子来解释,分别是市场风险溢价因子、市值规模因子(SMB)以及价值因子(HML)
R i = R f + β i ( R m − R f ) + β i , s S M B + β i , h H M L + α R_i = R _{f} + \beta _{i}(R _{m} - R _{f}) + \beta {i,s} SMB + \beta{i,h} HML + \alpha Ri=Rf+βi(Rm−Rf)+βi,sSMB+βi,hHML+α
三因子模型并不代表资本定价模型的完结,在最近的研究发现,三因子模型中还有很多未被解释的部分,如短期反转、中期动量、波动、偏度等因素。
比如四因子,五因子等。
所以更多的因子用来解释股票收益率,开启了多因子的篇章。
多因子模型
R i = α i + Σ k = 1 K β i , k F i , k + ϵ i R_i=\alpha_i+ \Sigma_{k=1}^{K}\beta_{i,k}F_{i,k}+\epsilon_i Ri=αi+Σk=1Kβi,kFi,k+ϵi
R i R_i Ri:资产的收益
α i \alpha_i αi:资产的预期收益
b e t a i , k beta_{i,k} betai,k:资产的收益率对因子中一个惊喜的敏感性,
ϵ i \epsilon_i ϵi:均值为零的误差项,它代表了 没有用因子模型解释的资产回报部分
上面的模型,都统一的转化为矩阵形式
R = α + β F + ϵ R=\alpha+\beta F+\epsilon R=α+βF+ϵ
有了上述理论基础,
最后就是制作量化策略,其中用的最多的是多因子策略
多因子策略研究流程
基础流程
数据获取 --> 数据挖掘 --> 策略构建 --> 策略回测 --> 策略分析 --> 模拟交易 --> 实盘交易。
一般流程
1、数据获取:数据准备,数据处理(去极值、标准化、市值中性化)
2、数据挖掘:单因子有效性分析与检验(单因子IC分析、因子收益率分析等),多因子分析与检验(多因子相关性分析、多因子组合分析等)
3、策略构建:因子权重确定(打分法、回归法计算因子权重),确定股票池及股票排序选股(因子相关性强弱、因子排序方向等)
4、策略回测:回测区间,调仓周期(日、月、季等)
5、策略分析:计算组合业绩表现
6、模拟交易:在交易软件上实时模型炒股收益
7:实盘交易:经历模型交易的考验,上实盘
以后的章节就是围绕以上述内容展开,敬请关注。