Pandas实战100例 | 案例 22: 分组运算

案例 22: 分组运算

知识点讲解

Pandas 的 groupby 方法允许你对数据进行分组,并对每个分组应用聚合函数,如求和、求平均、求最大值等。这对于分类数据的分析非常重要。

  • 分组后求和 : groupby 后使用 sum 方法可以对每个分组的数值求和。
  • 分组后求平均 : groupby 后使用 mean 方法可以计算每个分组的平均值。
  • 分组后求最大值 : groupby 后使用 max 方法可以找到每个分组的最大值。
示例代码
python 复制代码
# 准备数据和示例代码的运行结果,用于案例 22

# 示例数据
data_grouped_operations = {
    'Category': ['A', 'B', 'A', 'B', 'C', 'C', 'C'],
    'Values': [10, 15, 20, 25, 5, 10, 15]
}
df_grouped_operations = pd.DataFrame(data_grouped_operations)

# 分组运算
grouped_sum = df_grouped_operations.groupby('Category').sum()
grouped_mean = df_grouped_operations.groupby('Category').mean()
grouped_max = df_grouped_operations.groupby('Category').max()

df_grouped_operations, grouped_sum, grouped_mean, grouped_max

在这个示例中,我们首先根据 Category 列对 DataFrame 进行分组。然后,我们对每个分组计算了总和、平均值和最大值。

示例代码运行结果

原始 DataFrame (df_grouped_operations):

  Category  Values
0        A      10
1        B      15
2        A      20
3        B      25
4        C       5
5        C      10
6        C      15

分组后的求和 (grouped_sum):

          Values
Category        
A             30
B             40
C             30

分组后的平均值 (grouped_mean):

          Values
Category        
A           15.0
B           20.0
C           10.0

分组后的最大值 (grouped_max):

          Values
Category        
A             20
B             25
C             15

这个案例说明了如何对分类数据进行有效的分组和聚合运算,这对于理解数据集中的不同类别是非常有用的。

相关推荐
SafePloy安策1 小时前
ES信息防泄漏:策略与实践
大数据·elasticsearch·开源
学术搬运工1 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
Matrix702 小时前
HBase理论_背景特点及数据单元及与Hive对比
大数据·数据库·hbase
B站计算机毕业设计超人3 小时前
计算机毕业设计Python+大模型农产品价格预测 ARIMA自回归模型 农产品可视化 农产品爬虫 机器学习 深度学习 大数据毕业设计 Django Flask
大数据·爬虫·python·深度学习·机器学习·课程设计·数据可视化
Carl_奕然4 小时前
【大数据算法】MapReduce算法概述之:MapReduce基础模型
大数据·算法·mapreduce
Elastic 中国社区官方博客4 小时前
Elasticsearch 8.16:适用于生产的混合对话搜索和创新的向量数据量化,其性能优于乘积量化 (PQ)
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
飞翔的佩奇4 小时前
ElasticSearch:使用dsl语句同时查询出最近2小时、最近1天、最近7天、最近30天的数量
大数据·elasticsearch·搜索引擎·dsl
2301_769006785 小时前
19名专家被通报批评!国家科技重大专项评审违规!
大数据·人工智能·科技·sci·期刊·ssci
Yz98766 小时前
Kafka面试题
大数据·分布式·zookeeper·kafka·big data
爱搞技术的猫猫9 小时前
实现API接口的自动化
大数据·运维·数据库·性能优化·自动化·产品经理·1024程序员节