本文介绍如何利用 pd.crosstab 将分类变量(如顾客评分)按分组(如门店)展开为多个计数列,高效实现"一店一行、三评计数"的宽表转换,并控制列序与轴标签。 本文介绍如何利用 `pd.crosstab` 将分类变量(如顾客评分)按分组(如门店)展开为多个计数列,高效实现"一店一行、三评计数"的宽表转换,并控制列序与轴标签。在数据分析中,常需将长格式的分类计数数据(如每条记录代表一次门店评分)聚合为宽格式汇总表(如每行代表一家门店,各列分别显示 High / Medium / Low 的出现次数)。Pandas 提供了简洁高效的解决方案------pd.crosstab,它专为构建二维频数交叉表而设计。以下是一个典型场景:原始 DataFrame 包含两列 'Shop' 和 'Review',其中 'Review' 取值为 'High'、'Medium' 或 'Low',但同一店铺可能有多条评分记录。目标是生成新 DataFrame,每行唯一对应一个店铺,并新增三列分别统计该店各评分等级的数量。首先,构造示例数据:import pandas as pddata = \['store1', 'High', 'store1', 'Medium', 'store2', 'Low', 'store2', 'Low']df = pd.DataFrame(data, columns='Shop', 'Review')为确保输出列严格按 'High' → 'Medium' → 'Low' 顺序排列(而非默认字母序),推荐先将 'Review' 列转为有序分类类型(Categorical):df'Review' = pd.Categorical(df'Review', categories='High', 'Medium', 'Low')接着调用 pd.crosstab 进行交叉计数:result = pd.crosstab(df'Shop', df'Review')print(result)输出为: Zeemo AI 一款专业的视频字幕制作和视频处理工具
相关推荐
兵慌码乱9 小时前
基于Python+PyQt5+SQLite的药房管理系统实现:事务一致性与界面解耦全流程解析金銀銅鐵10 小时前
[Python] 体验用欧几里得算法计算最大公约数的过程FreakStudio14 小时前
W55MH32L-EVB 上手测评:硬件 TCP/IP 加持的以太网单片机,MicroPython 零门槛开发用户03321266636715 小时前
使用 Python 从零创建 Word 文档Csvn20 小时前
Python 两大经典坑点 —— 可变默认参数 & 闭包延迟绑定曲幽21 小时前
别再用网页翻译看源码了!你的私人翻译神器LibreTranslate,部署避坑指南来了用户556918817531 天前
#从脚本到独立程序:Python + Playwright 批量抓取的完整踩坑记录倔强的石头_1 天前
KingbaseES 新版MySQL 兼容版体验:旧版迁移 + 功能实测兵慌码乱2 天前
基于 MediaPipe 与 PySide2 的手势交互音乐控制系统实现:轻量化视觉交互全流程解析luckdewei2 天前
FastAPI 资产管理系统实战:复杂 ORM 关联、Alembic 迁移与 N+1 查询优化