Python数据分析之pandas的SQL风格

一、select选择

python 复制代码
SELECT username, password, secret, login_ip FROM tz_admin LIMIT 5;
data[['username', 'password', 'secret', 'login_ip']].head(5)
#在SQL中,选择是使用逗号分隔的列(或选择所有列)来完成的
#Pandas中,列的选择是通过传递列名到DataFrame:

二、where条件

SELECT * FROM order WHERE uid = '55' LIMIT 5;

dfdf\['充值(元)'>100]

三、groupby数据分组

数据分组是 pandas 数据分析的核⼼功能,可以将 DataFrame 根据⼀定的规则拆分为多个组合。

SELECT username, password, amount FROM user GROUP BY group;

df\['username','password','amount','group'].groupby(by='group')

pandas 中使用 groupby 方法时,它并不会立即执行分组操作。相反,它会返回一个 DataFrameGroupBy 对象,你需要对其应用聚合函数以获得有意义的结果。例如,你可以使用求和、均值、计数或任何其他聚合函数来对分组后的数据进行操作。

四、分组统计

1、计算平均值

df\['id','生日','city','充值(元)'].groupby(by='city').mean(numeric_only=True)

2、排序

3、频率

df2=df\['id','生日','city','充值(元)','性别'].groupby('city')'性别'.value_counts()

df2=df\['id','生日','city','充值(元)','性别'].groupby(by='city','性别').value_counts()

五、分组查看

最近心情比较烦,很烦,学不进去,未完待续,等我心静了再来学习

相关推荐
apocelipes11 小时前
常用编程语言和库的正则表达式性能对比
c语言·c++·python·性能优化·golang·开发工具和环境
用户83562907805113 小时前
使用 Python 在 PDF 中创建与管理书签
后端·python
MeixianAgent17 小时前
Python 回测数据入口怎么验?历史 K 线入库前先做 5 个检查
后端·python
咕白m62520 小时前
用 Python 实现一键批量查找与替换 Excel 数据
后端·python
SelectDB2 天前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
荣码2 天前
GraphRAG:普通RAG只能回答"点"的问题,我踩了4个坑才搞懂
java·python
金銀銅鐵2 天前
[Python] 基于欧几里得算法,实现分数约分计算器
python·数学
Lyn_Li2 天前
Kaggle Top 5 | 198只股票、200条数据的金融预测——BattleFin高分方案从零复现
python·kaggle·比赛复盘·金融预测
小九九的爸爸3 天前
前端想要入门Agent开发,要具备哪些Python基础?
python·agent·ai编程
阿耶同学3 天前
手把手教你用 LangGraph 搭建三层嵌套 Agent 架构
python·程序员