Python数据分析之pandas的SQL风格

一、select选择

python 复制代码
SELECT username, password, secret, login_ip FROM tz_admin LIMIT 5;
data[['username', 'password', 'secret', 'login_ip']].head(5)
#在SQL中,选择是使用逗号分隔的列(或选择所有列)来完成的
#Pandas中,列的选择是通过传递列名到DataFrame:

二、where条件

SELECT * FROM order WHERE uid = '55' LIMIT 5;

df[df['充值(元)']>100]

三、groupby数据分组

数据分组是 pandas 数据分析的核⼼功能,可以将 DataFrame 根据⼀定的规则拆分为多个组合。

SELECT username, password, amount FROM user GROUP BY group;

df[['username','password','amount','group']].groupby(by='group')

pandas 中使用 groupby 方法时,它并不会立即执行分组操作。相反,它会返回一个 DataFrameGroupBy 对象,你需要对其应用聚合函数以获得有意义的结果。例如,你可以使用求和、均值、计数或任何其他聚合函数来对分组后的数据进行操作。

四、分组统计

1、计算平均值

df[['id','生日','city','充值(元)']].groupby(by='city').mean(numeric_only=True)

2、排序

3、频率

df2=df[['id','生日','city','充值(元)','性别']].groupby('city')['性别'].value_counts()

df2=df[['id','生日','city','充值(元)','性别']].groupby(by=['city','性别']).value_counts()

五、分组查看

最近心情比较烦,很烦,学不进去,未完待续,等我心静了再来学习

相关推荐
端平入洛13 小时前
Python 可变对象与引用穿透:为什么改了"里面的东西"外面也变了?
python
woon13 小时前
从“涂掉红色”到“删除 PDF 对象”:一次 PDF 去印章脚本改造实践
python
老纪14 小时前
c++怎么利用std--variant处理多种二进制子协议包的自动分支解析【进阶】
jvm·数据库·python
茗创科技14 小时前
Nat Hum Behav | 特征选择会导致基于脑影像的机器学习生物标志物产生迥异的神经生物学解释
python·深度学习·机器学习·matlab·脑网络
IT策士14 小时前
Django 从 0 到 1 打造完整电商平台:Django 模型进阶与数据迁移
python·django·sqlite
OsDepK14 小时前
AudioSplit音频多轨免费分离工具即将发布
ide·git·python·音视频·集成学习
Metaphor69214 小时前
使用 Python 将 Excel 转换为 PDF
python·pdf·excel
彦为君14 小时前
长时间运行的 Agent:如何设计可靠的执行框架
python·ai·ai编程
qqqweiweiqq14 小时前
Jetson Orin nx 无法train pi0
人工智能·python·深度学习
AAA大运重卡何师傅(专跑国道)14 小时前
scrapling框架源码5/19
python