python数据分析总结(pandas)

目录

前言

df导入数据

df基本增删改查

数据清洗

​编辑

索引操作

数据统计

行列操作

​编辑

df->types

数据格式化

​编辑

日期数据处理


前言

此篇文章为个人python数据分析学习总结,总结内容大都为表格和结构图方式,仅供参考。

df导入数据

类型 语法
xls、xlsx pd.read_excel(io、sheet_name、index_col)
csv/txt pd.read_csv(filepath_or_buffer、encoding、sep、delimiter、index_col)
html pd.read_html(io、match、index_col、encoding) 注意io不支持https
mysql pd.read_sql(sql、con、index_col)

df基本增删改查

数据清洗

索引操作

方法 描述
reindex(index,columns,axis,fill_value,method) 使用指定行列序列值来设置索引(行或列)
set_index([col_names],drop) 使用已存在的列来设置索引
reset_index(drop) 重新设置索引

数据统计

注意:以下axis:0(列)、axis:1(行)

方法 描述
sort_values(by,ascending,inplace) 根据指定列来排序数据
rank(ascending,method) 对数据记录进行排序
value_counts(ascending,dropna) 对数据中的值进行计数
sum() 求和
mean() 平均值
max() 最大值
min() 最小值
median() 中位数
mode() 众数
var() 方差
quantile() 分位数
groupby(by) 分组
agg([agg_funcs]) 聚合方法
agg(agg_dict) 聚合

行列操作

df->types

转换类型 方法
df -> dict df.to_dict()
df -> list df.values.tolist()
df -> tuple [tuple(x) for x in df.values]

数据格式化

日期数据处理

相关推荐
lili-felicity1 分钟前
CANN模型量化详解:从FP32到INT8的精度与性能平衡
人工智能·python
数据知道4 分钟前
PostgreSQL实战:详解如何用Python优雅地从PG中存取处理JSON
python·postgresql·json
ZH154558913117 分钟前
Flutter for OpenHarmony Python学习助手实战:面向对象编程实战的实现
python·学习·flutter
玄同76518 分钟前
SQLite + LLM:大模型应用落地的轻量级数据存储方案
jvm·数据库·人工智能·python·语言模型·sqlite·知识图谱
User_芊芊君子23 分钟前
CANN010:PyASC Python编程接口—简化AI算子开发的Python框架
开发语言·人工智能·python
白日做梦Q33 分钟前
Anchor-free检测器全解析:CenterNet vs FCOS
python·深度学习·神经网络·目标检测·机器学习
喵手1 小时前
Python爬虫实战:公共自行车站点智能采集系统 - 从零构建生产级爬虫的完整实战(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集公共自行车站点·公共自行车站点智能采集系统·采集公共自行车站点导出csv
喵手1 小时前
Python爬虫实战:地图 POI + 行政区反查实战 - 商圈热力数据准备完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·地区poi·行政区反查·商圈热力数据采集
熊猫_豆豆1 小时前
YOLOP车道检测
人工智能·python·算法
nimadan121 小时前
**热门短剧小说扫榜工具2025推荐,精准捕捉爆款趋势与流量
人工智能·python