Python数据分析之pandas的SQL风格

一、select选择

python 复制代码
SELECT username, password, secret, login_ip FROM tz_admin LIMIT 5;
data[['username', 'password', 'secret', 'login_ip']].head(5)
#在SQL中,选择是使用逗号分隔的列(或选择所有列)来完成的
#Pandas中,列的选择是通过传递列名到DataFrame:

二、where条件

SELECT * FROM order WHERE uid = '55' LIMIT 5;

dfdf\['充值(元)'>100]

三、groupby数据分组

数据分组是 pandas 数据分析的核⼼功能,可以将 DataFrame 根据⼀定的规则拆分为多个组合。

SELECT username, password, amount FROM user GROUP BY group;

df\['username','password','amount','group'].groupby(by='group')

pandas 中使用 groupby 方法时,它并不会立即执行分组操作。相反,它会返回一个 DataFrameGroupBy 对象,你需要对其应用聚合函数以获得有意义的结果。例如,你可以使用求和、均值、计数或任何其他聚合函数来对分组后的数据进行操作。

四、分组统计

1、计算平均值

df\['id','生日','city','充值(元)'].groupby(by='city').mean(numeric_only=True)

2、排序

3、频率

df2=df\['id','生日','city','充值(元)','性别'].groupby('city')'性别'.value_counts()

df2=df\['id','生日','city','充值(元)','性别'].groupby(by='city','性别').value_counts()

五、分组查看

最近心情比较烦,很烦,学不进去,未完待续,等我心静了再来学习

相关推荐
❀搜不到11 小时前
Ubuntu查看指定Python程序的CPU、GPU、内存占用情况
linux·python·ubuntu
imbackneverdie11 小时前
深耕医学科研智能化十年,MedPeer打造新一代AI生物医学科研操作系统
大数据·人工智能·ai·信息可视化·数据分析·aigc·科研
卷无止境11 小时前
用一个机器车间,研究SimPy核心概念
python
zhendianluli12 小时前
PyTorch 复杂模型转 ONNX 踩坑纪实:从 diff 到 nan_to_num 的三关突破
人工智能·pytorch·python
python在学ing12 小时前
Django框架学习笔记:从零基础到项目实战
数据库·python·django·sqlite
PAK向日葵12 小时前
从零实现 Python 虚拟机(二):S.A.A.U.S.O 的总体架构设计
c++·python
程序员小远12 小时前
系统性能指标全解析
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·性能测试
@我们的天空13 小时前
Claude Code + GLM-5 深度赋能测试:开发 8 大 Skill 构建 AI 测试助手集群
人工智能·python·测试工具·自动化·ai编程
小白学大数据13 小时前
Playwright 爬虫:Python 爬取 JS 渲染的 JSP 网站
开发语言·javascript·爬虫·python·数据分析