Python数据分析之pandas的SQL风格

一、select选择

python 复制代码
SELECT username, password, secret, login_ip FROM tz_admin LIMIT 5;
data[['username', 'password', 'secret', 'login_ip']].head(5)
#在SQL中,选择是使用逗号分隔的列(或选择所有列)来完成的
#Pandas中,列的选择是通过传递列名到DataFrame:

二、where条件

SELECT * FROM order WHERE uid = '55' LIMIT 5;

df[df['充值(元)']>100]

三、groupby数据分组

数据分组是 pandas 数据分析的核⼼功能,可以将 DataFrame 根据⼀定的规则拆分为多个组合。

SELECT username, password, amount FROM user GROUP BY group;

df[['username','password','amount','group']].groupby(by='group')

pandas 中使用 groupby 方法时,它并不会立即执行分组操作。相反,它会返回一个 DataFrameGroupBy 对象,你需要对其应用聚合函数以获得有意义的结果。例如,你可以使用求和、均值、计数或任何其他聚合函数来对分组后的数据进行操作。

四、分组统计

1、计算平均值

df[['id','生日','city','充值(元)']].groupby(by='city').mean(numeric_only=True)

2、排序

3、频率

df2=df[['id','生日','city','充值(元)','性别']].groupby('city')['性别'].value_counts()

df2=df[['id','生日','city','充值(元)','性别']].groupby(by=['city','性别']).value_counts()

五、分组查看

最近心情比较烦,很烦,学不进去,未完待续,等我心静了再来学习

相关推荐
Quintus五等升几秒前
深度学习①|线性回归的实现
人工智能·python·深度学习·学习·机器学习·回归·线性回归
天远Date Lab5 分钟前
Python实战:对接天远数据手机号码归属地API,实现精准用户分群与本地化运营
大数据·开发语言·python
哈里谢顿27 分钟前
Python异常链:谁才是罪魁祸首?一探"The above exception"的时间顺序
python
哈里谢顿1 小时前
验证 list() 会调用 `__len__` 方法的深度解析
python·django
vibag2 小时前
构建智能体与工具调用
python·语言模型·大模型·langgraph
小途软件2 小时前
高校宿舍访客预约管理平台开发
java·人工智能·pytorch·python·深度学习·语言模型
-dcr2 小时前
49.python自动化
运维·python·自动化
code bean2 小时前
Flask图片服务在不同网络接口下的路径解析问题及解决方案
后端·python·flask
Chasing Aurora2 小时前
Python后端开发之旅(三)
开发语言·python·langchain·protobuf
于越海3 小时前
材料电子理论核心四个基本模型的python编程学习
开发语言·笔记·python·学习·学习方法