📊【Python时间序列全攻略】从入门到平稳性检验,一文搞定!
❝
💡金融、经济、气象、物联网......只要涉及"随时间变化的数据",就绕不开 时间序列分析 。
今天,我们就用 Python 带你系统掌握时间序列的核心技能!🔥
🕒 1. 日期与时间:一切的起点
在 Python 中,处理时间数据主要靠标准库 datetime 模块,它提供了几种关键类型:
| 类型 | 说明 |
|---|---|
date |
年-月-日(如 2026-02-07)📅 |
time |
时:分:秒(如 17:52:30)⏰ |
datetime |
日期 + 时间(最常用!)🕒 |
timedelta |
两个时间点之间的差值(用于加减计算)⏳ |
tzinfo |
时区信息(高级用法)🌍 |
✅ 小技巧:
-
用
datetime.now()获取当前时间 -
用
timedelta(days=3)轻松实现"三天后"或"一周前"
python
from datetime import datetime, timedelta
now = datetime.now()
three_days_later = now + timedelta(days=3)
🔁 2. 字符串 ↔ 时间:格式转换是关键!
现实数据常以字符串形式存在(如 "2026/02/07"),我们需要转换为 datetime 才能分析。
✅ 字符串 → datetime
python
datetime.strptime("2026-02-07", "%Y-%m-%d")
✅ datetime → 字符串
python
stamp.strftime("%Y年%m月%d日") # 输出:2026年02月07日
📌 常用格式代码速查表:
| 代码 | 含义 | 示例 |
|---|---|---|
%Y |
四位年份 | 2026 |
%m |
两位月份 | 02 |
%d |
两位日期 | 07 |
%H |
24小时制 | 17 |
%M |
分钟 | 52 |
%S |
秒 | 30 |
%F |
等价于 %Y-%m-%d |
2026-02-07 |
❝
⚡ 在 Pandas 中更简单:直接用
pd.to_datetime()一键转换整列!
📈 3. Pandas 时间序列:让数据"活"起来!
Pandas 是时间序列分析的利器!它的 Series 或 DataFrame 若以时间作为索引,就是时间序列。
python
import pandas as pd
dates = pd.date_range('2026-01-01', periods=5, freq='D')
ts = pd.Series([1, 2, 3, 4, 5], index=dates)
🔍 索引与切片超方便!
python
ts['2026-01-02'] # 单日查询
ts['2026-01'] # 整月切片
ts['2026'] # 整年数据
❝
✨ 自动对齐:不同时间序列做运算时,Pandas 会自动按日期对齐,不怕错位!
🗓️ 4. 日期范围 & 频率:生成你的专属时间轴!
用 pd.date_range() 轻松创建固定频率的时间序列:
python
# 每月最后一天,共12个月
pd.date_range('2026-01-01', periods=12, freq='M')
# 每小时一次,从现在开始
pd.date_range(start='2026-02-07 00:00', end='2026-02-08 00:00', freq='H')
🔄 常见频率别名(Frequency Aliases):
| 别名 | 含义 |
|---|---|
'D' |
日 |
'M' |
月末 |
'MS' |
月初 |
'H' |
小时 |
'T' 或 'min' |
分钟 |
'S' |
秒 |
➡️ 5. 时间移位(Shift):预测与滞后分析必备!
shift(n) 可将数据整体向前或向后移动 n 步,不改变索引:
python
ts.shift(1) # 滞后一期(昨天的值放到今天)
ts.shift(-1) # 超前一期(明天的值放到今天)
💡 若加上 freq 参数,则同时移动索引:
python
ts.shift(2, freq='D') # 数据+索引都往后移2天
❝
这在构建"昨日销量 vs 今日销量"等特征时超级实用!
📅 6. 时期(Period):不只是时间点,更是时间段!
Period 表示一个时间区间,比如"2026年2月"、"2026年第1季度"。
python
p = pd.Period('2026-02', freq='M') # 代表整个2月
-
用
pd.period_range()创建时期序列 -
用
asfreq()转换频率(如月 → 季) -
用
to_period()将时间戳索引转为时期索引
❝
🌟 适用于财务报表、月度汇总等"区间型"分析场景!
📉📈 7. 重采样(Resample):降采样 & 升采样
重采样 = 改变时间频率,是时间序列预处理的核心操作!
🔽 降采样(高频 → 低频)
比如:日数据 → 月数据
python
daily_data.resample('M').mean() # 每月平均值
⚠️ 注意参数:
-
closed='right':区间哪边闭合? -
label='right':标签打在哪一端?
🔼 升采样(低频 → 高频)
比如:月数据 → 日数据
此时会出现缺失值,需插值填充:
python
monthly_data.resample('D').ffill() # 向前填充
monthly_data.resample('D').interpolate() # 插值
🧪 8. 平稳性检验:建模前的关键一步!
大多数时间序列模型(如 ARIMA)要求数据平稳------即均值、方差不随时间变化。
三种检验方法:
1️⃣ 时序图检验 👀
-
绘制时间序列图
-
若无明显趋势或周期波动 → 可能平稳
python
data['Total'].plot(figsize=(12,6))
2️⃣ 自相关图(ACF)检验 📐
-
平稳序列:自相关系数快速衰减至0
-
非平稳序列:缓慢衰减
python
from statsmodels.graphics.tsaplots import plot_acf
plot_acf(data['Total'])
3️⃣ ADF 检验(最严谨!)🧪
-
原假设 H₀:序列非平稳(有单位根)
-
若 p-value < 0.05 → 拒绝 H₀ → 序列平稳!
python
from statsmodels.tsa.stattools import adfuller
result = adfuller(data['Total'])
print(f"ADF Statistic: {result[0]:.4f}")
print(f"p-value: {result[1]:.4f}")
❝
✅ 实践建议:先看图,再跑 ADF,双保险!
🎯 总结:时间序列分析全景图
python
graph LR
A[原始数据] --> B{是否为时间序列?}
B -->|是| C[转换为 datetime 索引]
C --> D[重采样/频率转换]
D --> E[移位/滞后特征]
E --> F[平稳性检验]
F -->|平稳| G[建模预测 ARIMA/SARIMA]
F -->|非平稳| H[差分/对数变换]
H --> F
🔔 关注我们 ,不错过每一篇硬核又易懂的数据科学干货!
💬 留言区互动:你在工作中遇到过哪些时间序列难题?欢迎分享!