本文介绍如何利用 pd.crosstab 将长格式的分类评分数据(如 high/medium/low)高效转换为按分组(如店铺)展开的宽表,自动生成对应类别的计数列,并控制类别顺序与轴标签。 本文介绍如何利用 pd.crosstab 将长格式的分类评分数据(如 high/medium/low)高效转换为按分组(如店铺)展开的宽表,自动生成对应类别的计数列,并控制类别顺序与轴标签。在数据分析中,常需将"长格式"(long format)的分组-类别记录(例如每条记录代表某店铺的一次顾客评分)聚合为"宽格式"(wide format)的汇总表------即每个唯一分组(如 Shop)作为一行,每个预定义类别(如 'High'、'Medium'、'Low')作为一列,单元格值为该店铺获得该评分的总次数。这种结构更便于后续统计、可视化或建模。pandas 提供了专为此类任务设计的高效函数:pd.crosstab。它本质是二维频数表生成器,支持索引(行分组)、列变量(类别维度)及可选的值聚合逻辑。为确保输出列严格按指定顺序(如 High → Medium → Low),推荐先将目标列转为有序分类类型(pd.Categorical),再传入 crosstab:import pandas as pd# 原始数据:长格式,含重复店铺IDdata = [['store1', 'High'], ['store1', 'Medium'], ['store2', 'Low'], ['store2', 'Low']]df = pd.DataFrame(data, columns=['Shop', 'Review'])# 步骤1:将 Review 列设为有序分类,明确指定类别顺序df['Review'] = pd.Categorical(df['Review'], categories=['High', 'Medium', 'Low'])# 步骤2:生成交叉表(行=Shop,列=Review)result = pd.crosstab(df['Shop'], df['Review'])print(result)输出:Review High Medium LowShop store1 1 1 0store2 0 0 2默认情况下,crosstab 会为行索引和列名添加轴标签(如 Shop 和 Review)。若需更简洁的表格结构(例如直接用于导出或合并),可链式调用 rename_axis 清除这些标签: 知网AI智能写作 知网AI智能写作,写文档、写报告如此简单
相关推荐
justjinji2 小时前
PHP函数如何识别PCI设备厂商ID_PHP获取扩展卡硬件标识【说明】2201_761040592 小时前
怎么监控MongoDB副本集的复制缓冲区积压_复制流速率评估2402_854808372 小时前
Layui tab选项卡如何动态根据ID值进行程序化切换m0_377618232 小时前
mysql如何设置字段为自动递增_使用alter table添加auto incrementkronos.荒2 小时前
N皇后问题(python)Wyz201210242 小时前
Navicat导入HTML网页报错怎么跳过_忽略错误记录高级选项小江的记录本2 小时前
【网络安全】《网络安全三大加密算法结构化知识体系》InfinteJustice2 小时前
CSS Grid布局如何实现响应式卡片网格_结合媒体查询调整列数2301_813599552 小时前
HTML函数开发用金属机身笔记本散热更好吗_材质对温控影响【指南】