Pandas实战100例 | 案例 22: 分组运算

案例 22: 分组运算

知识点讲解

Pandas 的 groupby 方法允许你对数据进行分组,并对每个分组应用聚合函数,如求和、求平均、求最大值等。这对于分类数据的分析非常重要。

  • 分组后求和 : groupby 后使用 sum 方法可以对每个分组的数值求和。
  • 分组后求平均 : groupby 后使用 mean 方法可以计算每个分组的平均值。
  • 分组后求最大值 : groupby 后使用 max 方法可以找到每个分组的最大值。
示例代码
python 复制代码
# 准备数据和示例代码的运行结果,用于案例 22

# 示例数据
data_grouped_operations = {
    'Category': ['A', 'B', 'A', 'B', 'C', 'C', 'C'],
    'Values': [10, 15, 20, 25, 5, 10, 15]
}
df_grouped_operations = pd.DataFrame(data_grouped_operations)

# 分组运算
grouped_sum = df_grouped_operations.groupby('Category').sum()
grouped_mean = df_grouped_operations.groupby('Category').mean()
grouped_max = df_grouped_operations.groupby('Category').max()

df_grouped_operations, grouped_sum, grouped_mean, grouped_max

在这个示例中,我们首先根据 Category 列对 DataFrame 进行分组。然后,我们对每个分组计算了总和、平均值和最大值。

示例代码运行结果

原始 DataFrame (df_grouped_operations):

复制代码
  Category  Values
0        A      10
1        B      15
2        A      20
3        B      25
4        C       5
5        C      10
6        C      15

分组后的求和 (grouped_sum):

复制代码
          Values
Category        
A             30
B             40
C             30

分组后的平均值 (grouped_mean):

复制代码
          Values
Category        
A           15.0
B           20.0
C           10.0

分组后的最大值 (grouped_max):

复制代码
          Values
Category        
A             20
B             25
C             15

这个案例说明了如何对分类数据进行有效的分组和聚合运算,这对于理解数据集中的不同类别是非常有用的。

相关推荐
TDengine (老段)14 分钟前
TDengine 数学函数 ABS() 用户手册
大数据·数据库·sql·物联网·时序数据库·tdengine·涛思数据
数据智能老司机1 小时前
数据工程设计模式——数据基础
大数据·设计模式·架构
笨蛋少年派2 小时前
HDFS简介
大数据·hadoop·hdfs
zskj_qcxjqr2 小时前
数字大健康浪潮下:智能设备重构人力生态,传统技艺如何新生?
大数据·人工智能·科技·机器人
1024find4 小时前
Spark on k8s部署
大数据·运维·容器·spark·kubernetes
计算机编程-吉哥12 小时前
大数据毕业设计-基于大数据的NBA美国职业篮球联赛数据分析可视化系统(高分计算机毕业设计选题·定制开发·真正大数据·机器学习毕业设计)
大数据·毕业设计·计算机毕业设计选题·机器学习毕业设计·大数据毕业设计·大数据毕业设计选题推荐·大数据毕设项目
计算机编程-吉哥12 小时前
大数据毕业设计-基于大数据的BOSS直聘岗位招聘数据可视化分析系统(高分计算机毕业设计选题·定制开发·真正大数据·机器学习毕业设计)
大数据·毕业设计·计算机毕业设计选题·机器学习毕业设计·大数据毕业设计·大数据毕业设计选题推荐·大数据毕设项目
RunningShare14 小时前
从“国庆景区人山人海”看大数据处理中的“数据倾斜”难题
大数据·flink
Hello.Reader15 小时前
Flink 执行模式在 STREAMING 与 BATCH 之间做出正确选择
大数据·flink·batch