掌握ARMA模型的识别和参数估计。
原始数据在文末!!!
练习1、
根据某1915-2004年澳大利亚每年与枪支有关的凶杀案死亡率(每10万人)数据(题目1数据.txt),求:
第1小题:
(1)通过单位根检验,判断该序列的平稳性;判断该序列的纯随机性;
(2) 绘制序列的样本自相关图(ACF)和偏自相关图(PACF),根据相关性特征,选择适当模型拟合该序列的发展;
(3)利用auto.arima()函数,对该序列进行系统自动定阶。
R
data <- read.table("F:/时间序列分析/实验6/习题数据/题目1数据.txt",header = T)
x <- ts(data[,2],start=1915)
#第1小题
#原序列ADF检验
library(aTSA)
adf.test(x)
#原序列白噪声检验
for(i in 1:2) print(Box.test(x,type = "Ljung-Box",lag = 6*i))
#原序列绘制自相关图和偏自相关图
par(mfrow = c(1,2))
acf(x)
pacf(x)
#自动识别模型
library(zoo)
library(forecast)
#系统自动定阶
auto.arima(x)
结果分析:
第1小题:
(1)
**单位根检验:**检验结果显示该序列可认为是平稳序列(带漂移项无滞后模型和既有漂移项又有趋势项的无滞后模型的P值小于0.05)。
Augmented Dickey-Fuller Test
alternative: stationary
Type 1: no drift no trend
lag ADF p.value
[1,] 0 -1.473 0.149
[2,] 1 -1.037 0.306
[3,] 2 -0.896 0.357
[4,] 3 -0.835 0.379
Type 2: with drift no trend
lag ADF p.value
[1,] 0 -4.54 0.0100
[2,] 1 -2.88 0.0543
[3,] 2 -2.25 0.2309
[4,] 3 -1.46 0.5330
Type 3: with drift and trend
lag ADF p.value
[1,] 0 -4.53 0.010
[2,] 1 -2.86 0.219
[3,] 2 -2.22 0.480
[4,] 3 -1.40 0.823
Note: in fact, p.value = 0.01 means p.value <= 0.01
**白噪声检验:**延迟6阶和延迟12阶的LB统计量的P值都小于α=0.05,则拒绝原假设,认为序列不是白噪声序列。
Box-Ljung test
data: x
X-squared = 92.781, df = 6, p-value < 2.2e-16
Box-Ljung test
data: x
X-squared = 108.89, df = 12, p-value < 2.2e-16
(2)
①自相关图可以看出,自相关系数是以一种有规律的方式,按指数函数轨迹衰减的,说明自相关系数衰减到零不是一个突然截尾的过程,而是一个连续渐变的过程,判定自相关系数拖尾;
②偏自相关图可以看出,除了1阶偏自相关系数在2倍标准差范围之外,之后几乎95%的偏自相关系数都在2倍标准差范围内,判定偏自相关系数1阶截尾;
综上所述,序列呈现出自相关系数拖尾,偏自相关系数1阶截尾的特性,初步确定拟合模型为AR(1)模型。
(3)系统自动定阶结果表明,该序列为ARMA(1,1)模型。
Series: x
ARIMA(1,0,1) with non-zero mean
Coefficients:
ar1 ma1 mean
0.9065 -0.5302 0.4616
s.e. 0.0682 0.1278 0.0591
sigma^2 = 0.01433: log likelihood = 64.48
AIC=-120.97 AICc=-120.5 BIC=-110.97
第2小题:
(1)绘制序列的时序图,判断该序列的平稳性;
(2)如果判断该序列非平稳,选择适当阶数(或步长)的差分运算。对差分后序列:做出时序图、白噪声检验、自相关图(ACF)和偏自相关图(PACF),选择适当模型拟合该差分后序列的发展(此处不要依赖系统自动定阶)
(3)选用适当估计方法确定上述拟合模型的口径。
R
#第2小题
#原序列时序图
plot(x)
#1阶差分
dif_x <- diff(x)
#绘制差分后序列的时序图
plot(dif_x)
#差分后序列的白噪声检验
for (i in 1:2) print(Box.test(dif_x,type = "Ljung-Box",lag = 6*i))
#绘制差分后序列的自相关图和偏自相关图
par(mfrow = c(1,2))
acf(dif_x)
pacf(dif_x)
#模型参数估计,确定模型的口径
#①选择AR(1)模型时模型的口径
arima(dif_x,order = c(1,0,0),method = "ML")
#③选择MA(3)模型时模型的口径
arima(dif_x,order = c(0,0,3),method = "ML")
结果分析:
第2小题:
- 从时序图可以看出,该序列存在明显的线性趋势,认为该序列是非平稳序列。
时序图:
- 选择1阶差分运算。
1 **阶差分后的时序图:**从1阶差分后序列的时序图可以看出1阶差分运算后,序列在常数0附近波动,且波动有界。认为1阶差分后的序列是平稳序列。
1 **阶差分后序列的白噪声检验:**延迟6阶和延迟12阶的LB统计量的P值为都小于α=0.05,则拒绝原假设,认为1阶差分后的序列不是白噪声序列。
Box-Ljung test
data: dif_x
X-squared = 21.986, df = 6, p-value = 0.001218
Box-Ljung test
data: dif_x
X-squared = 40.071, df = 12, p-value = 6.998e-05
ACF 图和PACF图:
- 从自相关图看出,除了1阶自相关系数在2倍标准差范围之外,之后几乎95%的自相关系数都突然衰减到2倍标准差范围之内。判定为1阶截尾;
- 从偏自相关图看出,除了1-3阶偏自相关系数在2倍标准差范围之外,之后几乎95%的自相关系数都突然衰减到2倍标准差范围之内。判定为3阶截尾;
综上所述,序列呈现出自相关系数1阶截尾的特性,偏自相关系数3阶截尾的特性,初步确定拟合模型为AR(1)模型或MA(3)模型。
(3)
①选择AR(1)模型时模型的口径为:
,
该AR(1)模型的等价表达为:
,
Call:
arima(x = dif_x, order = c(1, 0, 0), method = "ML")
Coefficients:
ar1 intercept
-0.4033 -0.0037
s.e. 0.0964 0.0096
sigma^2 estimated as 0.01589: log likelihood = 57.94, aic = -109.87
- 选择MA(3)模型时模型的口径为:
,
Call:
arima(x = dif_x, order = c(0, 0, 3), method = "ML")
Coefficients:
ma1 ma2 ma3 intercept
-0.5734 -0.0495 -0.0109 -0.0033
s.e. 0.1103 0.1069 0.1067 0.0047
sigma^2 estimated as 0.01421: log likelihood = 62.79, aic = -115.58
练习2、
根据1860-1955年密歇根湖每月平均水位的最高值序列(题目2数据.csv),求:
第1小题:
(1)通过单位根检验,判断该序列的平稳性;判断该序列的纯随机性;
(2) 绘制序列的样本自相关图(ACF)和偏自相关图(PACF),根据相关性特征,选择适当模型拟合该序列的发展;
(3)利用auto.arima()函数,对该序列进行系统自动定阶。
R
data <- read.csv("F:/时间序列分析/实验6/习题数据/题目2数据.csv",sep = ",",header = T)
x <- ts(data[,2],start=1860)
#第1小题
#原序列ADF检验
adf.test(x)
#原序列白噪声检验
for(i in 1:2) print(Box.test(x,type = "Ljung-Box",lag = 6*i))
#原序列绘制自相关图和偏自相关图
par(mfrow = c(1,2))
acf(x)
pacf(x)
#系统自动定阶
auto.arima(x)
结果分析:
第1小题:
- **单位根检验:**检验结果显示该序列可认为是平稳序列(带漂移项1阶滞后模型和既有漂移项又有趋势项的1阶滞后模型的P值小于0.05)。
Augmented Dickey-Fuller Test
alternative: stationary
Type 1: no drift no trend
lag ADF p.value
[1,] 0 -0.312 0.553
[2,] 1 -0.320 0.551
[3,] 2 -0.307 0.555
[4,] 3 -0.245 0.573
Type 2: with drift no trend
lag ADF p.value
[1,] 0 -2.88 0.0535
[2,] 1 -3.39 0.0154
[3,] 2 -2.73 0.0776
[4,] 3 -2.34 0.1973
Type 3: with drift and trend
lag ADF p.value
[1,] 0 -3.22 0.0891
[2,] 1 -4.03 0.0113
[3,] 2 -3.10 0.1204
[4,] 3 -2.60 0.3258
Note: in fact, p.value = 0.01 means p.value <= 0.01
**白噪声检验:**延迟6阶和延迟12阶的LB统计量的P值为都小于α=0.05,则拒绝原假设,认为序列不是白噪声序列。
Box-Ljung test
data: x
X-squared = 215.96, df = 6, p-value < 2.2e-16
Box-Ljung test
data: x
X-squared = 329.2, df = 12, p-value < 2.2e-16
(2)①自相关图可以看出,自相关系数是以一种有规律的方式,按指数函数轨迹衰减的,说明自相关系数衰减到零不是一个突然截尾的过程,而是一个连续渐变的过程,判定自相关系数拖尾;
②偏自相关图可以看出,除了1阶偏自相关系数在2倍标准差范围之外,之后几乎95%的偏自相关系数都在2倍标准差范围内,判定偏自相关系数1阶截尾;
综上所述,序列呈现出自相关系数拖尾,偏自相关系数1阶截尾的特性,初步确定拟合模型为AR(1)模型。
(3)利用auto.arima()函数,对该序列进行系统自动定阶:
Series: x
ARIMA(0,1,0)
sigma^2 = 0.4751: log likelihood = -99.44
AIC=200.87 AICc=200.92 BIC=203.43
第2小题:
(1)绘制序列的时序图,判断该序列的平稳性;
(2)如果判断该序列非平稳,选择适当阶数(或步长)的差分运算。对差分后序列:做出时序图、白噪声检验(延迟3阶和6阶)、自相关图(ACF)和偏自相关图(PACF),选择适当模型拟合该差分后序列的发展(此处不要依赖系统自动定阶)
(3)选用适当估计方法确定上述拟合模型的口径。
R
#第2小题
#原序列时序图
plot(x)
#1阶差分
dif_x <- diff(x)
#绘制差分后序列的时序图
plot(dif_x)
#差分后序列的白噪声检验
for (i in 1:2) print(Box.test(dif_x,type = "Ljung-Box",lag = 3*i))
#绘制差分后序列的自相关图和偏自相关图
par(mfrow = c(1,2))
acf(dif_x)
pacf(dif_x)
#模型参数估计,确定模型的口径
arima(dif_x,order = c(2,0,2),method = "ML")
第2小题:
(1)从时序图可以看出,该序列存在明显的线性趋势,认为该序列是非平稳序列。
时序图:
(2)选择1阶差分运算。
1 **阶差分后的时序图:**从1阶差分后序列的时序图可以看出1阶差分运算后,序列在常数0附近波动,且波动有界。认为1阶差分后的序列是平稳序列。
1 **阶差分后序列的白噪声检验:**延迟3阶的LB统计量的P值为0.01051小于α=0.05,但延迟6阶的LB统计量P值为0.0648,大于α=0.05,则拒绝原假设,认为1阶差分后的序列不是白噪声序列。
Box-Ljung test
data: dif_x
X-squared = 11.236, df = 3, p-value = 0.01051
Box-Ljung test
data: dif_x
X-squared = 11.876, df = 6, p-value = 0.0648
ACF 图和PACF图:
- 从自相关图看出,自相关系数呈现不规则地衰减到零值附近。判定为拖尾;
- 从偏自相关图看出,偏自相关系数呈现出对数函数单调收敛到零值附近。判定为拖尾特性;
综上所述,序列呈现出自相关系数拖尾的特性,偏自相关系数拖尾的特性,初步确定拟合模型为ARMA(2,2)模型。
(3)选择ARMA(2,2)模型时模型的口径为:
,
该ARMA(2,2)模型的等价表达为:
Call:
arima(x = dif_x, order = c(2, 0, 2), method = "ML")
Coefficients:
ar1 ar2 ma1 ma2 intercept
0.7210 -0.1642 -0.6746 -0.1715 -0.0189
s.e. 0.3128 0.4113 0.3091 0.4237 0.0281
sigma^2 estimated as 0.4081: log likelihood = -92.51, aic = 197.02
需要本训练原始数据请自行跳转下载: