Python数据分析之pandas的SQL风格

一、select选择

python 复制代码
SELECT username, password, secret, login_ip FROM tz_admin LIMIT 5;
data[['username', 'password', 'secret', 'login_ip']].head(5)
#在SQL中,选择是使用逗号分隔的列(或选择所有列)来完成的
#Pandas中,列的选择是通过传递列名到DataFrame:

二、where条件

SELECT * FROM order WHERE uid = '55' LIMIT 5;

df[df['充值(元)']>100]

三、groupby数据分组

数据分组是 pandas 数据分析的核⼼功能,可以将 DataFrame 根据⼀定的规则拆分为多个组合。

SELECT username, password, amount FROM user GROUP BY group;

df[['username','password','amount','group']].groupby(by='group')

pandas 中使用 groupby 方法时,它并不会立即执行分组操作。相反,它会返回一个 DataFrameGroupBy 对象,你需要对其应用聚合函数以获得有意义的结果。例如,你可以使用求和、均值、计数或任何其他聚合函数来对分组后的数据进行操作。

四、分组统计

1、计算平均值

df[['id','生日','city','充值(元)']].groupby(by='city').mean(numeric_only=True)

2、排序

3、频率

df2=df[['id','生日','city','充值(元)','性别']].groupby('city')['性别'].value_counts()

df2=df[['id','生日','city','充值(元)','性别']].groupby(by=['city','性别']).value_counts()

五、分组查看

最近心情比较烦,很烦,学不进去,未完待续,等我心静了再来学习

相关推荐
子燕若水5 小时前
uv 安装包
开发语言·chrome·python
weixin_307779135 小时前
Python获取能唯一确定一棵给定的树的最少数量的拓扑序列
数据结构·python
A.sir啊5 小时前
爬虫基础(六)代理简述
爬虫·python·网络协议
weixin_307779135 小时前
PySPARK带多组参数和标签的SparkSQL批量数据导出到S3的程序
大数据·数据仓库·python·sql·spark
Hi Man6 小时前
Python之如何在Visual Studio Code 中写的python程序打包成可以在Windows系统下运行的.exe程序
开发语言·vscode·python
Return-Log7 小时前
Matplotlab显示OpenCV读取到的图像
python·opencv
程序趣谈7 小时前
算法随笔_36: 复写零
数据结构·python·算法
九亿AI算法优化工作室&7 小时前
GWO优化LSBooST回归预测matlab
人工智能·python·算法·机器学习·matlab·数据挖掘·回归
灰灰老师7 小时前
数据分析系列--⑦RapidMiner模型评价(基于泰坦尼克号案例含数据集)
机器学习·ai·数据挖掘·数据分析·rapidminer
weixin_307779138 小时前
在AWS上使用Flume搜集分布在不同EC2实例上的应用程序日志具体流程和代码
python·flask·云计算·flume·aws