处理数据部分必备代码

1、读取数据出现UTF-8错误

python 复制代码
encoding="gbk"

2、进行时间系列的平均,并将平均后的数据转化为时间格式

python 复制代码
data.index = pd.to_datetime(data.index)
data = data.groupby(data.index.to_period('H')).mean()
data.index = data.index.to_timestamp()
df['hour'] = df.index.hour #提取时间中的小时
df.query('hour >= 9 and hour <= 12') # 选择小时范围在9到12小时内的数据

3、将不同的datafram合并

python 复制代码
pd.concat([df1,df2,df3],axis = 1)
#axis=1按列,axis=0按行

4、补全时间

python 复制代码
t_index = pd.date_range('2022-02-01 00:00:00', '2022-02-28 23:55:00', freq='5T')
df.index = pd.to_datetime(df.index, format='%Y-%m-%d %H:%M:%S')
df = df.reindex(t_index)

5、删除缺失值

python 复制代码
data.dropna(axis=0,how='all') #只删除行中所有为Nan值的行
data.dropna(axis=0,how='any')  # 删除行中有含有任何NaN的行
# axis控制行(0)和列(1)
相关推荐
qq_1249870753几秒前
基于Hadoop的黑龙江旅游景点推荐系统的设计与实现(源码+论文+部署+安装)
大数据·hadoop·分布式·python·信息可视化
不过如此19518 分钟前
Jira系统中JQL语句的介绍
python·sql·jira
不过如此195114 分钟前
Python操作Jira实现不同项目之间的Issue同步
python·jira·issue
曲幽19 分钟前
FastAPI + TinyDB并发陷阱与实战:告别数据错乱的解决方案
python·json·fastapi·web·并发·queue·lock·文件锁·tinydb
输出的都是我的26 分钟前
搭配GitHub Copilot 提升VS code使用技巧 - 新手向
vscode·python
电商API&Tina28 分钟前
跨境电商高并发 API 接口接入指南(技术落地 + 高可用优化)
大数据·服务器·前端·数据库·python·json
Amelia11111130 分钟前
day46
python
唐古乌梁海32 分钟前
Selenium元素定位不稳定
python·selenium·测试工具
2501_9418779836 分钟前
从调用链到因果关系的互联网工程语法重构与多语言实践随笔分享
开发语言·python
天天进步20151 小时前
Python全栈项目--基于Django的项目管理系统
开发语言·python·django