Python数据分析之pandas的SQL风格

一、select选择

python 复制代码
SELECT username, password, secret, login_ip FROM tz_admin LIMIT 5;
data[['username', 'password', 'secret', 'login_ip']].head(5)
#在SQL中,选择是使用逗号分隔的列(或选择所有列)来完成的
#Pandas中,列的选择是通过传递列名到DataFrame:

二、where条件

SELECT * FROM order WHERE uid = '55' LIMIT 5;

df[df['充值(元)']>100]

三、groupby数据分组

数据分组是 pandas 数据分析的核⼼功能,可以将 DataFrame 根据⼀定的规则拆分为多个组合。

SELECT username, password, amount FROM user GROUP BY group;

df[['username','password','amount','group']].groupby(by='group')

pandas 中使用 groupby 方法时,它并不会立即执行分组操作。相反,它会返回一个 DataFrameGroupBy 对象,你需要对其应用聚合函数以获得有意义的结果。例如,你可以使用求和、均值、计数或任何其他聚合函数来对分组后的数据进行操作。

四、分组统计

1、计算平均值

df[['id','生日','city','充值(元)']].groupby(by='city').mean(numeric_only=True)

2、排序

3、频率

df2=df[['id','生日','city','充值(元)','性别']].groupby('city')['性别'].value_counts()

df2=df[['id','生日','city','充值(元)','性别']].groupby(by=['city','性别']).value_counts()

五、分组查看

最近心情比较烦,很烦,学不进去,未完待续,等我心静了再来学习

相关推荐
小宁爱Python41 分钟前
从零搭建 RAG 智能问答系统3:聊天信息持久化和登录注册
python
天才少女爱迪生2 小时前
LLVM(Low Level Virtual Machine)介绍
python·数据挖掘
碳酸的唐5 小时前
A* 工程实践全指南:从启发式设计到可视化与性能优化
python·神经网络
倔强青铜三8 小时前
苦练Python第64天:从零掌握多线程,threading模块全面指南
人工智能·python·面试
Q264336502310 小时前
【有源码】基于Hadoop生态的大数据共享单车数据分析与可视化平台-基于Python与大数据的共享单车多维度数据分析可视化系统
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
计算机毕业设计木哥10 小时前
计算机毕设选题推荐:基于Hadoop和Python的游戏销售大数据可视化分析系统
大数据·开发语言·hadoop·python·信息可视化·spark·课程设计
小蕾Java10 小时前
PyCharm 2025:使用图文教程!
ide·python·pycharm
至此流年莫相忘10 小时前
配置Python环境之Conda
python·conda
cooldream200910 小时前
深入解析 Conda、Anaconda 与 Miniconda:Python 环境管理的完整指南
开发语言·python·conda