【分析式AI】-时间序列模型一文详解

时间序列模型指南


时间序列基础

专业术语解释:

时间序列是按照时间顺序排列的一系列数据点,通常是在连续等间隔的时间点上收集的数据。它建立了观察结果与时间变化的关系,可用于预测未来的趋势和模式。

大白话解释:

时间序列就是按时间顺序记录的数据,比如每天的温度、每月的销售额、每年的股价。通过分析这些数据随时间变化的规律,我们可以预测未来会怎样。

生活案例:

  • 天气预报:通过分析过去几年每天的温度、湿度数据,预测明天的天气。
  • 股票投资:查看某只股票过去一年的价格走势,判断未来可能涨还是跌。
  • 销售计划:根据过去几个月的销售数据,预测下个月需要准备多少库存。

时间序列 vs 回归分析

专业术语解释:

回归分析主要研究目标变量与一个或多个自变量之间的相关性,而时间序列分析专注于数据随时间变化的内部结构和动态特征,包括趋势、周期、季节性等时间相关模式。

大白话解释:

  • 回归分析:就像找原因和结果的关系,比如"学习时间"和"考试成绩"的关系。
  • 时间序列分析:专注于"时间"本身带来的变化规律,比如"随着月份变化,冰淇淋销量如何变化"。

生活案例:

  • 回归分析例子:研究"广告投入"对"产品销量"的影响。
  • 时间序列例子:分析"一年中不同月份"对"旅游景点游客量"的影响(夏天人多,冬天人少)。

时间序列成分分解

专业术语解释:

时间序列通常可以分解为四个组成部分:

  1. 趋势:长期持续的上升或下降方向
  2. 季节性:固定周期内的重复模式
  3. 周期性:非固定周期的波动
  4. 随机性:无法预测的偶然波动

大白话解释:

把时间序列数据像拆积木一样拆成几部分:

  • 趋势:整体是往上走还是往下走
  • 季节性:每年重复的规律,比如夏天冰淇淋卖得多
  • 周期性:几年一次的波动,比如经济周期
  • 随机性:突发事件的影响,比如突然的天气变化

生活案例:

  • 电力消耗分析
    • 趋势:随着经济发展,用电量整体上升
    • 季节性:夏天开空调多,用电高峰
    • 随机性:某天工厂突然停电检修

AR模型(自回归模型)

专业术语解释:

AR模型认为当前值可以通过过去若干个时刻的值的线性组合再加上白噪声来表示。公式为:Xₜ = φ₁Xₜ₋₁ + φ₂Xₜ₋₂ + ... + φₚXₜ₋ₚ + εₜ

大白话解释:

AR模型就像是"今天的天气可以通过前几天的天气来预测"。它假设今天的情况和过去几天的情况有关系。

生活案例:

  • 预测明天温度:用今天、昨天、前天的温度来预测明天温度
  • 股票预测:用过去5天的股价预测明天股价
  • 交通流量:用上周同一天同一时间的车流量预测今天车流量

MA模型(滑动平均模型)

专业术语解释:

MA模型认为当前值可以通过过去若干个时刻的随机误差(白噪声)的线性组合来表示。公式为:Xₜ = εₜ + θ₁εₜ₋₁ + θ₂εₜ₋₂ + ... + θₚεₜ₋ₚ

大白话解释:

MA模型关注的是"意外事件"的影响。它认为今天的情况不仅受今天的"意外"影响,还受过去几天"意外"的影响。

生活案例:

  • 餐厅收入:今天收入受今天天气(意外)、昨天促销活动(昨天意外)的影响
  • 电商销量:销量受今天广告投放、昨天网站故障的影响

ARMA模型(自回归滑动平均模型)

专业术语解释:

ARMA模型结合了AR和MA模型,既考虑了过去值的影响,也考虑了过去随机误差的影响。公式为ARMA(p,q)模型。

大白话解释:

ARMA模型是AR和MA的"合体版",既看过去的实际值,也看过去的"意外情况"。

生活案例:

  • 预测房价:既考虑过去几个月的房价趋势(AR部分),也考虑政策变化等意外因素(MA部分)
  • 预测客流:既考虑过去几天的客流量,也考虑天气突变等意外影响

ARIMA模型(差分自回归滑动平均模型)

专业术语解释:

ARIMA模型在ARMA基础上增加了差分步骤,先对非平稳序列进行差分使其平稳,再用ARMA模型建模。表示为ARIMA(p,d,q),其中d为差分阶数。

大白话解释:

ARIMA就是"先平整土地,再建房子"。如果数据波动太大(不平整),先通过差分把它弄平稳,再用ARMA模型分析。

生活案例:

  • 预测GDP增长:GDP数据有很强的增长趋势,先差分去掉趋势,再预测
  • 股价预测:股价整体趋势明显,先差分处理,再分析短期波动

差分解释

专业术语解释:

差分是通过计算相邻观测值之间的差异来消除序列中的趋势或季节性,使非平稳序列变为平稳序列。

大白话解释:

差分就是"计算相邻两个数的差值"。比如计算"今天比昨天增加了多少",而不是直接看"今天的绝对值是多少"。

生活案例:

  • 原始数据:[100, 110, 121, 133.1, 146.41](每年增长10%)
  • 一次差分:[10, 11, 12.1, 13.31](每年增加的量,更平稳)
  • 分析增长量比分析原始值更容易发现规律

Statsmodels工具

专业术语解释:

Statsmodels是Python中用于统计建模和计量经济学的库,提供时间序列分析、回归分析、假设检验等功能。

大白话解释:

Statsmodels是一个"统计工具箱",里面有各种分析数据的工具,包括专门分析时间序列的工具。

生活案例:

  • 就像木工有锯子、锤子、尺子一样,数据分析师用Statsmodels这个工具箱里的各种工具处理数据

ARMA工具使用

专业术语解释:

通过statsmodels库中的ARMA类可以构建ARMA模型,需要指定内生变量、模型阶数(p,q),并可选择外生变量。

大白话解释:

用代码"告诉"计算机:我想用ARMA模型分析这些数据,过去7天的数据对今天有影响(p=7),不考虑意外因素(q=0)。

代码示例解释:

python 复制代码
# 创建ARMA(7,0)模型:用过去7天预测今天,不考虑意外因素
arma = ARMA(data, (7,0)).fit()
# 预测1990-2000年的数据
predict_y = arma.predict('1990', '2000')

AIC准则(赤池信息准则)

专业术语解释:

AIC是衡量统计模型拟合优度的标准,在模型复杂度与拟合度之间取得平衡,数值越小表示模型越好。

大白话解释:

AIC就像"模型评分卡",分数越低越好。它既看模型预测准不准,也看模型是不是太复杂。

生活案例:

  • 选择旅游路线
    • 复杂路线:去10个景点,很累但玩得多(AIC可能高)
    • 简单路线:去3个精华景点,轻松又满足(AIC可能低)
    • AIC帮我们找到"性价比最高"的路线

相关推荐
AI即插即用2 小时前
即插即用系列 | CMPB PMFSNet:多尺度特征自注意力网络,打破轻量级医学图像分割的性能天花板
网络·图像处理·人工智能·深度学习·神经网络·计算机视觉·视觉检测
love530love2 小时前
在 PyCharm 中配置 x64 Native Tools Command Prompt for VS 2022 作为默认终端
ide·人工智能·windows·python·pycharm·prompt·comfyui
图导物联2 小时前
商场室内导航系统:政策适配 + 技术实现 + 代码示例,打通停车逛店全流程
大数据·人工智能·物联网
柒.梧.2 小时前
CSS 基础样式与盒模型详解:从入门到实战进阶
人工智能·python·tensorflow
WLJT1231231232 小时前
“人工智能+”引领数字产业迈入价值兑现新阶段
人工智能
JH灰色2 小时前
【大模型】-微调-BERT
人工智能·深度学习·bert
free-elcmacom2 小时前
机器学习高阶教程<9>从实验室到生产线:机器学习模型推理与部署优化实战指南
人工智能·python·机器学习
Felaim2 小时前
【自动驾驶】RAD 要点总结(地平线)
人工智能·机器学习·自动驾驶
Pyeako2 小时前
机器学习--逻辑回归相关案例
人工智能·python·机器学习·逻辑回归·下采样·交叉验证·过采样