Pandas实战100例 | 案例 13: 数据分类 - 使用 `cut` 对数值进行分箱

惊鸿若梦一书生2024-01-14 22:08

案例 13: 数据分类 - 使用 `cut` 对数值进行分箱

知识点讲解

在数据分析中，将连续的数值数据分类成不同的区间（或"分箱"）是一种常见的做法。Pandas 提供了 cut 函数，它可以根据你指定的分箱边界将数值数据分配到不同的类别中。

使用 cut 进行分箱 : 你可以指定一系列的边界来定义分箱，然后将这些边界应用于数据列。cut 还允许你为每个箱指定标签。

示例代码

python 复制代码

# 准备数据和示例代码的运行结果，用于案例 13

# 示例数据
data_categorization = {
    'Product': ['Apple', 'Banana', 'Cherry', 'Date', 'Elderberry'],
    'Price': [5, 3, 9, 7, 1]
}
df_categorization = pd.DataFrame(data_categorization)

# 使用 cut 进行分箱
df_categorization['PriceRange'] = pd.cut(df_categorization['Price'], bins=[0, 2, 5, 10], labels=['Low', 'Medium', 'High'])

df_categorization

在这个示例中，我们对产品价格进行了分类。我们定义了三个价格区间：低（0-2）、中等（2-5）、高（5-10），并使用 cut 函数将每个产品的价格分配到这些区间中。

示例代码运行结果

复制代码

      Product  Price PriceRange
0       Apple      5     Medium
1      Banana      3     Medium
2      Cherry      9       High
3        Date      7       High
4  Elderberry      1        Low

这个结果展示了每个产品根据其价格被分配到的相应区间。这种方法对于分类分析和制作分组统计非常有用。

上一篇：微服务实战系列之Filter

下一篇：在Spring Cloud微服务项目中遇到Redis CPU飙升

热门推荐

01Coze实战第13讲：飞书多维表格读取+豆包生图模型，轻松批量生成短剧封面 02如何将markdown生成pdf 03Coze扣子平台完整体验和实践（附国内和国际版对比）04Word粘贴时出现“运行时错误53,文件未找到：MathPage.WLL“的解决方案 05手机电脑之间快速传输图片视频文件，不压缩画质、不限制大小的方法！06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07GPU 进阶笔记（二）：华为昇腾 910B GPU 08鸽了六年的某大厂面试题：你会手写一个模板引擎吗？09DeepSeek各版本说明与优缺点分析 10扣子空间的使用教程与大模型技术思考