Pandas实战100例 | 案例 22: 分组运算

案例 22: 分组运算

知识点讲解

Pandas 的 groupby 方法允许你对数据进行分组,并对每个分组应用聚合函数,如求和、求平均、求最大值等。这对于分类数据的分析非常重要。

  • 分组后求和 : groupby 后使用 sum 方法可以对每个分组的数值求和。
  • 分组后求平均 : groupby 后使用 mean 方法可以计算每个分组的平均值。
  • 分组后求最大值 : groupby 后使用 max 方法可以找到每个分组的最大值。
示例代码
python 复制代码
# 准备数据和示例代码的运行结果,用于案例 22

# 示例数据
data_grouped_operations = {
    'Category': ['A', 'B', 'A', 'B', 'C', 'C', 'C'],
    'Values': [10, 15, 20, 25, 5, 10, 15]
}
df_grouped_operations = pd.DataFrame(data_grouped_operations)

# 分组运算
grouped_sum = df_grouped_operations.groupby('Category').sum()
grouped_mean = df_grouped_operations.groupby('Category').mean()
grouped_max = df_grouped_operations.groupby('Category').max()

df_grouped_operations, grouped_sum, grouped_mean, grouped_max

在这个示例中,我们首先根据 Category 列对 DataFrame 进行分组。然后,我们对每个分组计算了总和、平均值和最大值。

示例代码运行结果

原始 DataFrame (df_grouped_operations):

复制代码
  Category  Values
0        A      10
1        B      15
2        A      20
3        B      25
4        C       5
5        C      10
6        C      15

分组后的求和 (grouped_sum):

复制代码
          Values
Category        
A             30
B             40
C             30

分组后的平均值 (grouped_mean):

复制代码
          Values
Category        
A           15.0
B           20.0
C           10.0

分组后的最大值 (grouped_max):

复制代码
          Values
Category        
A             20
B             25
C             15

这个案例说明了如何对分类数据进行有效的分组和聚合运算,这对于理解数据集中的不同类别是非常有用的。

相关推荐
飞飞传输2 小时前
守护医疗隐私,数据安全摆渡系统撑起内外网安全伞!
大数据·运维·安全
Guheyunyi2 小时前
视频安全监测系统的三大核心突破
大数据·运维·服务器·人工智能·安全·音视频
阿里云大数据AI技术3 小时前
1TB数据,ES却收到了2TB?揪出那个客户端中的“隐形复读机”
大数据·elasticsearch
初恋叫萱萱3 小时前
【TextIn大模型加速器 + 火山引擎】文件智能体构建全路径指南
大数据·数据库·火山引擎
安达发公司3 小时前
安达发|效率革命:APS自动排程,为“金属丛林”安装精准导航
大数据·运维·人工智能·aps高级排程·aps排程软件·安达发aps·aps自动排程
科士威传动4 小时前
精密仪器中的微型导轨如何选对润滑脂?
大数据·运维·人工智能·科技·机器人·自动化
Lion Long4 小时前
大数据时代的“时间”难题:时序数据库(TSDB)选型避坑指南
大数据·数据库·时序数据库·数据库架构·iotdb·tsdb
dixiuapp4 小时前
智能报修系统从连接到预测的价值跃迁
大数据·人工智能·物联网·sass·工单管理系统
星月心城4 小时前
git提交代码时所遇问题
大数据·git·elasticsearch
天远数科4 小时前
Go语言金融风控:天远 全能小微企业报告组合接口的 AES 加密与异构 JSON 解析
大数据·golang·json