python数据分析总结(pandas)

目录

前言

df导入数据

df基本增删改查

数据清洗

​编辑

索引操作

数据统计

行列操作

​编辑

df->types

数据格式化

​编辑

日期数据处理


前言

此篇文章为个人python数据分析学习总结,总结内容大都为表格和结构图方式,仅供参考。

df导入数据

类型 语法
xls、xlsx pd.read_excel(io、sheet_name、index_col)
csv/txt pd.read_csv(filepath_or_buffer、encoding、sep、delimiter、index_col)
html pd.read_html(io、match、index_col、encoding) 注意io不支持https
mysql pd.read_sql(sql、con、index_col)

df基本增删改查

数据清洗

索引操作

方法 描述
reindex(index,columns,axis,fill_value,method) 使用指定行列序列值来设置索引(行或列)
set_index(col_names,drop) 使用已存在的列来设置索引
reset_index(drop) 重新设置索引

数据统计

注意:以下axis:0(列)、axis:1(行)

方法 描述
sort_values(by,ascending,inplace) 根据指定列来排序数据
rank(ascending,method) 对数据记录进行排序
value_counts(ascending,dropna) 对数据中的值进行计数
sum() 求和
mean() 平均值
max() 最大值
min() 最小值
median() 中位数
mode() 众数
var() 方差
quantile() 分位数
groupby(by) 分组
agg(agg_funcs) 聚合方法
agg(agg_dict) 聚合

行列操作

df->types

转换类型 方法
df -> dict df.to_dict()
df -> list df.values.tolist()
df -> tuple tuple(x) for x in df.values

数据格式化

日期数据处理

相关推荐
lqjun08271 分钟前
PyTorch梯度计算
人工智能·pytorch·python
词元Max2 分钟前
3.1 Agent开发需要懂多少数学?
人工智能·python
许彰午3 分钟前
06_Java面向对象入门
java·开发语言·python
ZHW_AI课题组4 分钟前
使用 Rectified Flow 和 Diffusion Transformer实现 MNIST 手写数字图像生成
人工智能·python·机器学习
Royzst7 分钟前
一、IO 概述
开发语言·python
Omics Pro9 分钟前
P4医学4大支柱需绑定4大数字技术才可落地
人工智能·python·算法·机器学习·plotly
海鸥-w10 分钟前
前端学习python第三天笔记整理(list 列表,str字符串,tuple元组,set集合,dect,函数,类型注解)
前端·python·学习
机器学习是魔鬼16 分钟前
在矩池云上开箱即用Energy Forecasting:能源电力电价预测实战指南
人工智能·python·机器学习
想要成为糕糕手18 分钟前
从Python基础到LLM接口实战:在Notebook上实现AI自动生成亚马逊电商文案
python·openai
郝学胜-神的一滴21 分钟前
力扣 144:二叉树前序遍历的优雅实现
java·数据结构·c++·python·算法·leetcode·职场和发展