(七)Pandas时序数据 学习简要笔记 #Python #CDA学习打卡

一. 时序数据简介

1)定义

时间序列(time series),就是由时间构成的序列,它指的是在一定时间内按照时间顺序测量的某个变量的取值序列,比如一天内的温度会随时间而发生变化,或者股票的价格会随着时间不断的波动,这里用到的一系列时间,就可以看做时间序列。时间序列包含三种应用场景,分别是:

  • 特定的时刻(timestamp),也就是时间戳;
  • 固定的日期(period),比如某年某月某日;
  • 时间间隔(interval),每隔一段时间具有规律性

2)类型

Pandas时序处理中最常见的两种数据类型为datetime和timedelta。

datetime:既有日期date也有时间time,表示一个具体的时间点(时间戳)。

timedelta:两个时间点之间的差,比如2020-01-01和2020-01-02之间的timedelta即为一天。

二. 创建时间序列数据

1)使用to_datetime创建时间序列

2)使用pd.date_range()创建一段连续的时间范围

start是起始日期,end是结束日期,freq是频率,这里设置为'D'表示每天。

3)使用Timestamp()函数创建一个特定的时间戳

4)使用datetime模块创建时间戳

三. 时长数据计算

1)计算两个时间数据之差(Timedelta)

2)计算时间戳:固定时间+Timedelta类型的时间差

四. 时序索引

1)将日期作为索引创建时间序列

periods是时间序列的长度,freq是频率,这里设置为D'表示每天。

2)索引和切片

(a)使用日期进行索引

(b)使用日期范围进行切片

(c)使用切片操作对数据进行访问

3)重采样(resample)(最重要)

重采样是指将时间序列数据的频率转换为其他频率(基于时间的groupby操作)

重采样主要有两种类型:

1、升采样(Upsampling)

升采样可以增加数据的频率或粒度(**从低频到高频),**将数据转换成更小的时间间隔。

2、降采样(Downsampling)

降采样包括减少数据的频率或粒度(**从高频到低频),**将数据转换为更大的时间间隔。

以降采样为例:

W'表示按周进行重采样,mean()表示计算每周的平均值。

整个过程其实就是一个groupby过程:

  • 对原有的数据按照指定的频率进行切分,分到不同的group中
  • 对不同的group执行操作
  • 整合操作结果

4)滚动计算(rolling)

计算滚动平均值:window=3表示窗口大小为3,即计算每3个数据的平均值。

5)时间偏移(shift)

将时间序列向前或向后移动

1表示向后移动1个时间单位

五. 时间访问器dt:提取出时间/日期的属性

在Pandas中,可以使用dt访问器来访问时间戳或时间序列中的各个时间部分,例如年、月、日、小时、分钟、秒等。当数据中的时间列(本数据中为trade_date列)已经转换为datetime64格式时,仅需调用.dt接口,即可快速求得想要的结果,下表中列出了.dt接口所提供的常见属性:

1)创建一个时间序列

2)提取年份

3)提取月份

4)提取日期

5)提取小时

6)提取分钟

7)提取秒数

8)提取季度

9)提取周数

10)获取星期几的名称

11)获取该日期是一年中的第几天

12)获取该日期是一周中的第几天

13)获取该日期是一个月中的第几天

14)获取该日期所在月份的最后一天

六. 时长转化

1)创建时间戳序列

2)提取时间戳中的秒数

下一期:Pandas窗口数据,Bye!

相关推荐
好奇龙猫28 分钟前
日语学习-日语知识点小记-构建基础-JLPT-N3阶段-二阶段(19):阶段练习
学习
松涛和鸣1 小时前
11.C 语言学习:递归、宏定义、预处理、汉诺塔、Fibonacci 等
linux·c语言·开发语言·学习·算法·排序算法
心无旁骛~2 小时前
Masquerade 总结笔记:解锁野外人类视频的机器人政策学习潜力
笔记·机器人
IT痴者2 小时前
《PerfettoSQL 的通用查询模板》---Android-trace
android·开发语言·python
谅望者3 小时前
数据分析笔记14:Python文件操作
大数据·数据库·笔记·python·数据挖掘·数据分析
l1t3 小时前
调用python函数的不同方法效率对比测试
开发语言·数据库·python·sql·duckdb
观远数据4 小时前
数据驱动零售新生态:观远BI打造终端经营“透视镜”
大数据·人工智能·信息可视化·数据分析·零售
2501_941111404 小时前
使用Scrapy框架构建分布式爬虫
jvm·数据库·python
今天吃饺子4 小时前
如何用MATLAB调用python实现深度学习?
开发语言·人工智能·python·深度学习·matlab
萧鼎4 小时前
Python Mahotas 图像处理库:高性能计算机视觉工具
图像处理·python·计算机视觉