pandas学习小结

基础操作

查看数据

df.head()

df.tail()

df.sample(5)

df.info()

df.describe()

索引

df.set_index('col_name', inplace=True/False) 设置某列为索引

查询数据

查看单列 df['Q1'] 返回一个series 带索引

查看多列 df[['Q1', 'Q2']]

查看多列 df.loc[:, ['Q1', 'Q2']]

索引是名称 直接用索引 df[df.index == 'liver']

查前三行 df[0:3] df[0:10:2]

iloc查行 df.iloc[:10, :]

行列同时查

df.loc['Ben', 'Q1': 'Q4']

df.loc['Eorge': 'Alexander', 'team': 'Q4']

过滤查询

单条件查询 df[df.Q1 > 90] / df[df['Q1'] > 90]

多条件查询 注意要假括号 不然报错 df[(df.Q1 > 60) & (df.Q1 < 80)]

另一种多条件查询 df[df.Q1 > 60].loc[df.Q1 < 80]

排序

单列降序排序 df.sort_values(by='cola_name', ascending=False)

多列分别排序 df.sort_values(by=['cola', 'colb'], ascending=[True, False])

分组聚合

df.groupby('team').sum()

df.groupby('team').mean()

df.groupby('team').agg({'Q1':'sum', 'Q2': 'mean'})

相关推荐
im_AMBER44 分钟前
算法笔记 16 二分搜索算法
c++·笔记·学习·算法
赵文宇(温玉)1 小时前
不翻墙,基于Rancher极速启动Kubernetes,配置SSO登录,在线环境开放学习体验
学习·kubernetes·rancher
lingggggaaaa2 小时前
免杀对抗——C2远控篇&PowerShell&有无文件落地&C#参数调用&绕AMSI&ETW&去混淆特征
c语言·开发语言·笔记·学习·安全·microsoft·c#
wdfk_prog4 小时前
[Linux]学习笔记系列 -- [kernel]workqueue
linux·笔记·学习
wdfk_prog5 小时前
[Linux]学习笔记系列 -- [kernel]usermode_helper
linux·笔记·学习
冬夜戏雪5 小时前
【学习日记】【刷题回溯、贪心、动规】
学习
一只爱做笔记的码农5 小时前
【BootstrapBlazor】移植BootstrapBlazor VS工程到Vscode工程,报error blazor106的问题
笔记·学习·c#
xixixi777775 小时前
“C2隐藏”——命令与控制服务器的隐藏技术
网络·学习·安全·代理·隐藏·合法服务·c2隐藏
名字不相符6 小时前
攻防世界WEB难度一(个人记录)
学习·php·web·萌新
陈天伟教授6 小时前
基于学习的人工智能(4)机器学习基本框架
人工智能·学习·机器学习