金融时间序列【量化理论】

业界常用的技术分析指标都与价格本身有关，而时间序列分析由于对数据平稳性的要求常常是基于收益率这样更加偏稳定的数据（收益率由于会涨停和跌停每天最多10%）

平稳性：

强平稳性：随时间变化，各个统计特征都保持不变，那么这个随机过程具有强平稳性------一般我们只要求金融序列是弱平稳性的也就是均值，方差，协方差随着时间的变化不会发生变化即可

注意‼️：对于不平稳的数据很有可能会产生伪回归

用ARIMA构建有关收益率的时间序列:

在时间序列当中，最简单的模型就是ARIMA模型,其中，AR的含义是自回归，I的含义是差分，MA的含义是移动平均

其中，自回归系数的计算方法：

在AR模型中要对AR模型进行平稳性检验:

又因为白噪声有如下特征：

对原AR求期望可以得到：

有平稳性特征：期待值是相同的

因此进一步化简：

我们称该方程的解的倒数为模型的特征根

当他的特征根的模都小于1，则可以认为序列是平稳的

如下是ARIMA模型简单的代码实例：

python 复制代码

import numpy as np
 
import pandas as pd
 
import matplotlib.pyplot as plt
 
from statsmodels.tsa.stattools import acf, pacf
 
 
 
# 设置支持中文的字体
 
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用黑体显示中文
 
plt.rcParams['axes.unicode_minus'] = False  # 正确显示负号
 
 
 
# 数据准备
 
data = {
 
    '年份': list(range(1997, 2024)),
 
    '报考人数': [24.20, 27.40, 31.90, 39.20, 46.00, 62.40, 79.70, 94.50, 117.20, 127.12, 128.20, 120.00, 124.60, 140.00, 151.10, 165.60, 176.00, 172.00, 164.90, 177.00, 201.00, 238.00, 290.00, 341.00, 377.00, 457.00, 474.00],
 
    '录取率': [21.08, 21.17, 20.38, 21.69, 24.02, 31.25, 33.88, 34.92, 27.72, 31.69, 28.40, 32.50, 33.31, 33.71, 32.76, 31.48, 30.73, 31.90, 34.58, 33.32, 35.82, 32.02, 27.93, 29.05, 27.87, 24.15, 24.23]
 
}
 
df = pd.DataFrame(data)
 
df.set_index('年份', inplace=True)
 
 
 
# 选择一个时间序列列，例如 '报考人数'
 
ts = df['报考人数']
 
 
 
# 计算ACF和PACF值
 
acf_values = acf(ts, nlags=9)
 
pacf_values = pacf(ts, nlags=13)
 
 
 
# 计算置信区间
 
conf_int = 1.96 / np.sqrt(len(ts))
 
 
 
# 绘制ACF柱状图
 
plt.figure(figsize=(12, 6))
 
plt.bar(range(len(acf_values)), acf_values, color='blue', alpha=0.7)
 
plt.axhline(y=0, color='black', linestyle='--')
 
plt.axhline(y=-conf_int, color='red', linestyle='--', label='95% 置信区间')
 
plt.axhline(y=conf_int, color='red', linestyle='--')
 
plt.title('ACF图')
 
plt.xlabel('滞后期')
 
plt.ylabel('自相关系数')
 
plt.xticks(range(len(acf_values)), labels=range(len(acf_values)))
 
plt.legend()
 
plt.show()
 
 
 
# 绘制PACF柱状图
 
plt.figure(figsize=(12, 6))
 
plt.bar(range(len(pacf_values)), pacf_values, color='blue', alpha=0.7)
 
plt.axhline(y=0, color='black', linestyle='--')
 
plt.axhline(y=-conf_int, color='red', linestyle='--', label='95% 置信区间')
 
plt.axhline(y=conf_int, color='red', linestyle='--')
 
plt.title('PACF图')
 
plt.xlabel('滞后期')
 
plt.ylabel('偏自相关系数')
 
plt.xticks(range(len(pacf_values)), labels=range(len(pacf_values)))
 
plt.legend()
 
plt.show()