平稳时间序列
时间序列的基本统计特性,如均值、方差和自相关等,在时间上不随时间的推移而发生显著的变化。
平稳时间序列通常具有以下特征:
- 均值不随时间变化:序列的均值在时间上保持恒定。
- 方差不随时间变化:序列的方差在时间上保持恒定。
- 自相关性不随时间变化:序列的自相关性在时间上保持恒定。
需要注意的是,对于非平稳时间序列,我们可能会观察到随着时间的推移,均值、方差或自相关性发生显著的变化,这会导致在建模和预测过程中产生偏误和误差。因此,为了进行可靠的时间序列分析,首先需要对时间序列进行平稳性检验 ,如果时间序列不是平稳的,则需要采取相应的方法来使其平稳化,例如差分、对数变换等。
矩
自回归(AR模型)
自相关函数(ACF)
ACF代表自相关函数 (Autocorrelation Function),是时间序列分析中一种重要的工具。它用于衡量时间序列自身延迟版本之间的相关性。通常情况下,自相关函数在滞后(lag)为不同值时会给出不同的相关系数。具体来说,ACF在滞后为0时给出的是序列与自身完全相关的情况,而在滞后为1、2、3等时则给出序列与自身滞后1、2、3等期之间的相关性。
在时间序列建模和预测中,ACF常常用于识别自回归(AR)模型的阶数。如果自相关函数在滞后k处呈现出显著的正相关性,那么可能存在一个自回归模型的滞后k阶的特征。
给定时间序列 Y t Y_t Yt,其自相关函数ACF(k)在滞后k时的值表示为:
ACF ( k ) = 协方差 ( Y t , Y t − k ) 方差 ( Y t ) \text{ACF}(k) = \frac{{\text{协方差}(Y_t, Y_{t-k})}}{{\text{方差}(Y_t)}} ACF(k)=方差(Yt)协方差(Yt,Yt−k)
其中,( Y_t ) 是时间序列在时刻t的值,( Y_{t-k} ) 是时间序列在时刻t-k的值,协方差表示时间序列在不同时刻之间的协方差,方差表示时间序列的方差。
偏自相关函数(PACF)
与自相关函数(ACF)不同,偏自相关系数的计算需要先排除其他滞后阶数的影响 ,然后计算出两个时刻之间的相关性
信息准则
信息准则(Information Criterion)是一种在统计建模中用于选择最优模型的方法之一。它们提供了一种衡量模型复杂度和拟合优度之间折衷的方式。常见的信息准则包括赤池信息准则(AIC)和贝叶斯信息准则(BIC)。
在使用信息准则进行模型选择时,通常选择具有最小AIC或BIC值的模型作为最优模型。这意味着选取的模型在拟合数据的同时,也尽量避免了过拟合的问题。
显著性检验
显著性检验是统计学中常用的一种方法,用于判断样本数据的统计量是否显著地偏离了某个假设的预期值 。这个假设通常称为原假设(null hypothesis),而显著性检验的目标是根据样本数据来判断原假设是否应该被拒绝。
在进行显著性检验时,一般会先设置原假设和备择假设(alternative hypothesis),然后根据样本数据计算出一个统计量(test statistic)。接着,根据这个统计量以及一定的显著性水平(significance level),可以通过查找相应的分布表或计算p值(p-value)来判断原假设是否应该被拒绝。
常见的显著性检验包括:
-
t检验(Student's t-test):用于比较两个样本均值是否有显著差异。
-
卡方检验(Chi-square test):用于检验两个分类变量之间的关联性。
-
F检验(F-test):用于比较两个或多个样本方差是否相等。
-
Z检验(Z-test):用于检验一个样本的均值是否与已知的总体均值有显著差异。
-
Wilcoxon秩和检验(Wilcoxon rank-sum test):用于比较两个独立样本的中位数是否有显著差异。
在进行显著性检验时,需要注意选择适当的检验方法和显著性水平,并理解检验结果的解释和可能存在的限制。通常,当p值小于显著性水平(通常为0.05或0.01)时,我们会拒绝原假设,认为样本数据提供了足够的证据来支持备择假设。否则,我们无法拒绝原假设,但并不意味着原假设是正确的,而可能是由于样本数据不足或其他因素导致的。
拟合优度
移动平均(MA模型)
自回归(AR)与移动平均(MA)对比
-
移动平均模型(MA):
- 移动平均模型是基于过去数据的线性组合来预测未来数据的模型。
- MA模型假设当前时刻的数据点是过去若干个时刻的白噪声(随机扰动项)的线性组合,其中白噪声的均值为0,方差为常数。
- MA模型的阶数(order)表示过去的时间间隔,称为滞后项(lag),记作MA(q),其中q表示滞后项的个数。
- MA模型的主要优点是对于非常平稳(stationary)的数据有较好的拟合效果,适用于没有明显趋势和季节性的数据。
- 对MA§模型,ACF对定阶有意义,因为其P后截尾;
-
自回归模型(AR):
- 自回归模型是基于过去数据的自身延迟值来预测未来数据的模型。
- AR模型假设当前时刻的数据点是过去若干个时刻的数据点的线性组合,其中每个时刻的数据点都有一定的权重。
- AR模型的阶数(order)表示过去的时间间隔,称为滞后项(lag),记作AR§,其中p表示滞后项的个数。
- AR模型的主要优点是可以捕捉到数据中的趋势和周期性,适用于有明显自相关性的数据。
- 对AR(Q)模型,PACF对定阶有意义,因为其Q后截尾;
VAR模型
向量自回归(vectorautoregression,VAR)是一种预测算法,当两个或多个时间序列相互影响时可以使用 。也即,所涉及的时间序列之间的关系是双向的。
AR模型 更适用于单变量时间序列数据 的建模和预测,而VAR模型 更适用于多变量时间序列数据的建模和预测
如果序列是平稳的,我们直接根据数据拟合VAR模型(称为"水平VAR")来进行预测;如果序列非平稳,则将数据进行差分使其变得平稳,在此基础上拟合VAR模型(称为"差分VAR")。在这两种情况下,型都是利用最小二乘原理对方程逐一进行估计的。
VAR模型还可用来检验一个变量与另一个变量是否存在因果关系 (格兰杰因果关系)
步骤:
-
首先我们需要对变量的时间序列进行ADF单位根检验,如果为平稳序列,可以进行回归模型的构造。
-
如若序列不平稳,直接进行建模将造成伪回归,可以对序列进行差分,当进行到第i次差分后使得序列平稳,且所有检验序列均服从同阶单整,在经过协整性检验后,可以通过建立误差修正模型(ECM)来构造 VAR模型
-
最后是 VAR 模型滞后阶数的确定 ,由于不能判断哪个滞后阶数为最优,因此需要一个个试,一般根据 AIC、BIC或HQIC等信息准则数值为最小时,所对应的滞后阶数为最优。
ARIMA模型
ARIMA是 Auto Regressive Integrated Moving Average 的缩写,该类模型可以根据**自身的过去值(即其自身的滞后和滞后的预测误差)**理解给定的时间序列,因此可以使用方程式预测未来价值。如果时间序列具有季节性模式,则需要添加季节性条件,并且该时间序列将变为SARIMA("季节性ARIMA"的缩写)
随机游走
随机游走模型不可预测
带漂移项的随机游走
在AR和ARMA模型中, 常数项与平稳均值有关。 但是在带漂移的随机游动模型中, 常数项\mu是每一步的平均增量,是固定线性趋势的斜率。
ARIMA
对ARIMA模型建模, 只要计算漂移随机游走Yt的差分, 然后对差分建立ARMA模型即可
波动率的特征
- 存在波动率聚集(volatility clustering)
- 波动率随时间连续变化,一般不出现波动率的跳跃式变动
- 波动率一般在固定的范围内变化,意味着动态的波动率是平稳的
- 在资产价格大幅上扬和大幅下跌两种情形下, 波动率的反映不同, 大幅下跌时波动率一般也更大, 这种现象称为杠杆效应(leverage effect)
ARCH模型
设r_t是某种资产在时刻的基于某时间单位(如天、月、年)的对数收益率
GARCH模型
随机波动率模型
ARMA - ARCH
ARMA 模型是自回归移动平均模型 ,用于时间序列数据的建模,它可以识别和描述时间序列数据中的自回归和移动平均的关系 。
ARCH 模型是自回归条件异方差模型 ,主要用于处理时间序列数据中的波动性和异方差性。
ARMA 模型和 ARCH 模型的对比可以从以下几个方面来看:
-
功能:
- ARMA 模型主要用于对时间序列的自相关和移动平均效应进行建模和预测;
- ARCH 模型则更关注数据中波动性的建模,尤其是波动的异方差性。
-
应用领域:
- ARMA 模型常用于金融时间序列数据的分析和预测;
- ARCH 模型更多地用于金融领域的波动性建模,例如预测金融资产的风险。
-
优势和劣势:
- ARMA 模型能够处理由平稳时间序列产生的相关性,但它无法很好地处理时间序列数据中的异方差性;
- ARCH 模型在处理时间序列数据中的异方差性时非常有效,但它常常忽略了序列数据中的自相关性。
-
组合应用:
- 在实际分析过程中,可以结合ARMA和ARCH模型,运用ARMA建模数据的均值,用ARCH建模数据使用的波动性,这样可以更全面地描述时间序列数据的特征。
Garch 模型和BS模型预测波动率的区别
时间序列模型是根据历史数据建立合适的模型,预测未来------GARCH模型------历史波动率;
根据市场正在交易的期权价格提取信息, "翻译"出市场对未来波动率的预期------BS------隐含波动率
- 在预测期限较短 (一周)时,GARCH(1,1)模型所含信息较多,预测能力最强,
- 但在预测较长期限 (一个月)时,隐含波动率所含信息较多,预测能力较强。
- 同时,期权市场交易越活跃,所反映的信息就越全面,隐含波动率的预测能力也就越强
历史波动率
历史波动率估计法的逻辑基础在于假定股票波动率水平在过去和未来保持不变, 主要包括简单移动平均法和 GARCH 模型方法。
- GARCH模型是用来根据历史 波动率 来预测未来波动率的,根据历史数据来获取参数,使之符合历史回测。
- 基本的GARCH模型可以刻画波动率历史分布的一些特性,特别是 均值回归 和厚尾性(如果残差噪声选择为非正态如t-分布)。
- 增强版的GARCH,如 GJR-GARCH, 可以刻画更多的特性,如非对称性 。GARCH模型预测的波动率可以用于风险管理,如VaR的计算。
缺点:
- 首先,从样本中总结出来的规律有可能是伪规律,或者出现过度拟合的问题;
- 其次,这种方法要求历史必须重演,即从样本中找到的规律必须适用于未来;
- 最后,这种方法没有考虑最新信息和市场环境的变化等历史信息之外的其他信息
隐含波动率
与GARCH模型对于历史波动率的预测不同,隐含波动率包含了风险溢价
金融市场中每日形成的价格反映了供求双方从历史数据和最新资讯中获取各种信息后形成的预期,包含了信息容量最大和最具前瞻性的事前预测信息,而且不断动态更新调整,因此隐含波动率法有它得天独厚的优势
- BS模型中的波动率,本质上是期权定价的一类模型参数。
- 从 香草期权 的市场价格,将BS公式反推可以得到 隐含波动率 。其与历史波动率是完全不同的,是一个市场变量而不是历史参数。
- 期权交易 的本质实际上就是交易隐含波动率,后者反映了市场对于未来波动率走向的一种趋势的预测。
总结
- GARCH 模型是基于历史信息判断未来,历史是否重演,何时重演,本身是一个不确定的问题。而在经济突发事件出现时,依据历史信息的预测就变得更不可靠。
- 隐含波动率与 GARCH波动率不同,它加入了人们出于当前经济金融形势对未来的判断 ,并不去假设未来一定会重复历史。众多交易者出于对未来的判断给出了期权的交易价格,根据该价格,用 BS 公式翻译出人们对未来波动率的预期。因而,当期权市场的参与者众多,且比较明智、成熟时,由交易形成的期权价格则比较合理,而由这样的期权价格得到的隐含波动率在预测未来波动率方面会优于时间序列模型。可以想见,参与者越多,交易量越大,人们对未来的判断就越准确。
马尔科夫模型
马尔可夫模型是一个研究离散时间随机过程(Xi, i = 1, 2, ,3 ,4 ...)的方法。它的主要思想是将各个事件Xi的互相影响区分开:假设每一个事件xi只与前一次发生的事件Xi-1直接相关,而与再之前的事件Xi-2, Xi-3等不直接产生关系
马尔可夫过程(Markov Process)是一种随机过程,具有"马尔可夫性质",即未来状态的概率分布只依赖于当前状态,而与过去的状态无关。在金融领域,马尔可夫过程常用于描述资产价格的变化,例如随机游走模型(Random Walk)、布朗运动(Brownian Motion)等。
卡尔曼滤波器模型
卡尔曼滤波是一种用于动态系统状态估计的优化技术,通常应用于具有线性动态系统和高斯噪声的情况。在股票价格预测中,卡尔曼滤波可以用于对股票价格的平滑和预测。
-
建立状态空间模型: 首先,需要建立一个状态空间模型,其中包括状态方程和观测方程。状态方程描述了股票价格随时间变化的动态过程,通常假设为线性系统,而观测方程描述了通过观测数据获取的股票价格信息。
-
初始化状态和协方差矩阵: 在开始卡尔曼滤波之前,需要初始化状态向量和状态协方差矩阵。状态向量包含对系统状态的初始估计,而状态协方差矩阵表示对初始估计的不确定性。
-
预测步骤(预测状态和协方差): 在每个时间步中,利用状态方程和先前的状态估计来预测当前时刻的状态和状态协方差。这一步通常称为"预测步骤"。
-
更新步骤(更新状态和协方差): 在观测到新的股票价格数据后,利用观测方程和预测得到的状态来更新状态向量和状态协方差矩阵。这一步通常称为"更新步骤"。
-
重复迭代: 上述预测和更新步骤将被重复迭代,以便根据新的观测数据不断更新状态估计,并得到对未来股票价格的预测。
卡尔曼滤波的关键优势在于它可以利用历史价格数据和噪声模型来动态地调整状态估计,并且能够有效地处理数据中的不确定性。通过将观测数据与动态系统模型进行融合,卡尔曼滤波能够提供对股票价格未来走势的较为准确的预测。然而,需要注意的是,卡尔曼滤波通常假设系统是线性的,并且噪声是高斯分布的,因此在实际应用中需要注意模型的适用性。
CAPM模型
它把任何一种 风险证券 的价格都划分为三个因素: 无风险收益率 、风险的价格和风险的计算单位
如果一个股票的价格和市场的价格波动性是一致的,那么这个股票的Beta值就是1。如果一个股票的Beta是1.5,就意味着当市场上升10%时,该 股票价格 则上升15%;而市场下降10%时,股票的价格亦会下降15%。
有效前沿
马科维兹有效前沿(Efficient Frontier)是指在给定风险水平下,投资组合能够实现的最高收益率或者在给定收益率水平下,能够实现的最低风险水平。有效前沿是现代投资组合理论的核心概念之一,由哈里·马科维茨于1952年提出。
有效前沿的基本概念是在投资组合的各种资产配置中,寻找一种最佳的平衡,以在给定的风险水平下获得最高的预期收益率,或在给定的收益率水平下获得最低的风险 。
资本市场线CML
资本市场线是沿着投资组合的有效边界,由风险资产和无风险资产构成投资组合。
- 资本市场线是在资产组合理论中使用的一条直线,表示在给定风险水平下可实现的最佳投资组合。
- CML的形成基于有效边界,即在给定风险水平下,投资者可以获得的最高预期收益率。
- CML上的每个点都代表了一种资产组合,其中投资者以无风险资产和风险资产的某种比例进行投资。(例如,A点是一个完全由风险资产构成的投资组合;资本市场线上的其他各个点分别表示由A点的证券组合与无风险资产(y轴截距)共同构成的投资组合。)
- CML的斜率代表了风险资产和无风险资产的组合比例,而截距则代表了无风险利率。
证券市场线SML
证券市场线表明证券或**证券组合收益(资产预期收益率)与贝塔系数(系统性风险)**之间的关系。
-
处于SML下方的任何资产或投资组合代表资产价值被高估。
处于SML上方的任何资产或投资组合代表资产价值被低估。
-
SML表明,资产的预期收益率应与其系统性风险(β值)成正比,且与无风险利率和市场组合的预期收益率之差成正比。
-
SML的斜率表示了资产的市场风险溢价(市场风险与预期收益率之间的关系) ,而截距则代表了无风险利率。
至少在如下两个方面,证券市场线区别于资本市场线。
首先,横轴的标志是贝塔系数。
第二,证券市场线(SML)无论对于单个证券还是证券组合都可以成立,而资本市场线(CML)只对于有效组合才能成立 。
APT套利定价模型
APT(Arbitrage Pricing Theory)是由斯蒂芬·罗斯(Stephen Ross)于1976年提出的资本资产定价理论。与CAPM类似,APT也是用来解释资本市场的理论模型,但是它与CAPM在假设和方法上有所不同。
APT的核心思想是,资产的回报可以通过多个因素来解释,而不仅仅是市场因子 。这些因素可能包括市场因子、利率变动、通货膨胀率等 。与CAPM不同,APT不要求投资者有相同的预期回报或共享相同的信息,但它假设市场上不存在套利机会,即不存在无风险的收益 。
APT模型假设资产的回报与多个因子之间存在线性关系,通过对历史数据进行回归分析,可以估计出每个因子的权重和资产的因子载荷。然后,根据这些因子载荷和未来的因子值,可以预测资产的未来回报。
fama-french三因子模型
改进了CAPM模型(CAPM只有市场风险 )。该模型是用来解释资产收益率的变化,并考虑了影响股票收益率的三个主要因素,即市场风险、市值因子和账面市值比因子。
-
市场风险因子(Market Risk Factor): 这个因子是CAPM模型中的市场组合收益率的简化版本,通常用市场指数(如标普500指数)的收益率来代表。它捕捉了整个市场的风险水平,即市场上涨和下跌对股票收益率的影响。
-
市值因子(Size Factor): 这个因子衡量了公司的市值对其股票收益率的影响。通常通过将股票按市值大小分组,然后计算不同市值组合之间的收益率差异来衡量。
-
账面市值比因子(Book-to-Market Ratio Factor): 这个因子衡量了公司的账面市值比(BM比,即账面价值与市值的比率)对其股票收益率的影响。通常通过将股票按BM比大小分组,然后计算不同BM比组合之间的收益率差异来衡量。
ATP套利定价理论、CAPM资本资产定价模型
异同点
共同假设:
1. 投资者 有相同的投资理念;
2. 投资者是非满足的,要求 效用最大化 ;
3. 市场是完全的。
资本资产定价模型 多出如下假设:
- 单一投资期;
- 不存在 税收 ;
- 投资者能以 无风险利率 自由借贷;
- 投资者以 收益率 的均值和 方差 为基础选择 投资组合 。
- 并未对投资者的风险偏好作出假定。
套利定价理论与资本资产定价模型的联系
(1)二者都假定了资本市场上不存在交易成本或交易税,或者都认为如果存在交易成本、交易税,则其对所有的投资者而言都是相同的。
(2)二者都将存在的风险划分为系统性风险和非系统性风险,也就是市场风险和公司自身的风险。而且两种模型都认为通过投资的多元化组合,通过投资者的合理优化投资结构,能够大部分甚至完全消除公司自身存在的风险 。因此,在计算投资组合的预期回报时,两种模型的数学表达式都认为资本市场不会由于投资者承担了这部分风险而给予他们补偿,因而不列入计算式中。
(3)资本资产定价理论可以看做是套利定价理论在更严格假设条件下的特例。
套利定价理论与资本资产定价模型的作用
-
资产定价 :CAPM可以用来确定资产或投资组合的合理预期收益率。通过CAPM,投资者可以估计投资所承担的风险水平与预期收益之间的关系,从而确定投资组合的合理配置。
-
风险调整 :CAPM可以帮助投资者根据风险水平对资产或投资组合进行调整。通过CAPM,投资者可以了解到一个资产或投资组合相对于市场的风险,从而决定是否值得承担这种风险。
-
投资决策 :CAPM提供了一个框架,帮助投资者在风险与回报之间做出理性的投资决策。投资者可以根据CAPM的预期收益率和风险水平来评估不同资产或投资组合的吸引力,从而选择最佳的投资方案。
-
资本预算 :CAPM可以用于资本预算,即评估项目的潜在回报率和风险水平。通过将项目的风险调整后的收益率与资本成本相比较,可以帮助企业决定是否值得进行投资。