Pandas实战100例 | 案例 22: 分组运算

案例 22: 分组运算

知识点讲解

Pandas 的 groupby 方法允许你对数据进行分组,并对每个分组应用聚合函数,如求和、求平均、求最大值等。这对于分类数据的分析非常重要。

  • 分组后求和 : groupby 后使用 sum 方法可以对每个分组的数值求和。
  • 分组后求平均 : groupby 后使用 mean 方法可以计算每个分组的平均值。
  • 分组后求最大值 : groupby 后使用 max 方法可以找到每个分组的最大值。
示例代码
python 复制代码
# 准备数据和示例代码的运行结果,用于案例 22

# 示例数据
data_grouped_operations = {
    'Category': ['A', 'B', 'A', 'B', 'C', 'C', 'C'],
    'Values': [10, 15, 20, 25, 5, 10, 15]
}
df_grouped_operations = pd.DataFrame(data_grouped_operations)

# 分组运算
grouped_sum = df_grouped_operations.groupby('Category').sum()
grouped_mean = df_grouped_operations.groupby('Category').mean()
grouped_max = df_grouped_operations.groupby('Category').max()

df_grouped_operations, grouped_sum, grouped_mean, grouped_max

在这个示例中,我们首先根据 Category 列对 DataFrame 进行分组。然后,我们对每个分组计算了总和、平均值和最大值。

示例代码运行结果

原始 DataFrame (df_grouped_operations):

复制代码
  Category  Values
0        A      10
1        B      15
2        A      20
3        B      25
4        C       5
5        C      10
6        C      15

分组后的求和 (grouped_sum):

复制代码
          Values
Category        
A             30
B             40
C             30

分组后的平均值 (grouped_mean):

复制代码
          Values
Category        
A           15.0
B           20.0
C           10.0

分组后的最大值 (grouped_max):

复制代码
          Values
Category        
A             20
B             25
C             15

这个案例说明了如何对分类数据进行有效的分组和聚合运算,这对于理解数据集中的不同类别是非常有用的。

相关推荐
爱编程的王小美2 小时前
Elasticsearch详解
大数据·elasticsearch·搜索引擎
大湾区经济门户网3 小时前
中国移动启动数字乡村“五新升级”:年底前,行政村5G覆盖达95%
大数据·5g·区块链·媒体
小诸葛的博客5 小时前
es中节点类型有哪些
大数据·elasticsearch·jenkins
随缘而动,随遇而安5 小时前
第四十篇 企业级数据仓库建模深度实践:从理论到落地的维度建模全攻略
大数据·数据库·数据仓库·数据分析·数据库架构
2501_911067667 小时前
探秘叁仟智盒设备:智慧城市的智能枢纽
大数据·人工智能·智慧城市
黄雪超8 小时前
核心知识—— RDD常用算子之数据转换
大数据·spark
AWS官方合作商8 小时前
AWS云服务:大数据公司实现技术突破与商业价值的核心引擎
大数据·云计算·aws
码界筑梦坊11 小时前
基于Spark的抖音数据分析热度预测系统
大数据·信息可视化·数据分析·spark·毕业设计·个性化推荐
生信学习小达人13 小时前
arcgis10.8 Toolbox中没有找到conversion tools模块
大数据
Oo_Amy_oO14 小时前
Airflow+Spark/Flink vs. Kettle
大数据·flink·spark