本文介绍如何利用 pd.crosstab 将分类变量(如顾客评分)按分组(如门店)展开为多个计数列,高效实现"一店一行、三评计数"的宽表转换,并控制列序与轴标签。 本文介绍如何利用 `pd.crosstab` 将分类变量(如顾客评分)按分组(如门店)展开为多个计数列,高效实现"一店一行、三评计数"的宽表转换,并控制列序与轴标签。在数据分析中,常需将长格式的分类计数数据(如每条记录代表一次门店评分)聚合为宽格式汇总表(如每行代表一家门店,各列分别显示 High / Medium / Low 的出现次数)。Pandas 提供了简洁高效的解决方案------pd.crosstab,它专为构建二维频数交叉表而设计。以下是一个典型场景:原始 DataFrame 包含两列 'Shop' 和 'Review',其中 'Review' 取值为 'High'、'Medium' 或 'Low',但同一店铺可能有多条评分记录。目标是生成新 DataFrame,每行唯一对应一个店铺,并新增三列分别统计该店各评分等级的数量。首先,构造示例数据:import pandas as pddata = \['store1', 'High', 'store1', 'Medium', 'store2', 'Low', 'store2', 'Low']df = pd.DataFrame(data, columns='Shop', 'Review')为确保输出列严格按 'High' → 'Medium' → 'Low' 顺序排列(而非默认字母序),推荐先将 'Review' 列转为有序分类类型(Categorical):df'Review' = pd.Categorical(df'Review', categories='High', 'Medium', 'Low')接着调用 pd.crosstab 进行交叉计数:result = pd.crosstab(df'Shop', df'Review')print(result)输出为: Zeemo AI 一款专业的视频字幕制作和视频处理工具
相关推荐
大数据魔法师3 小时前
Streamlit(二十三)- 教程(二)- 动态导航AI人工智能+电脑小能手5 小时前
【大白话说Java面试题 第87题】【Mysql篇】第17题:分布式事务的实现原理?yyuuuzz5 小时前
独立站的技术基础与常见运维问题心中有国也有家6 小时前
GE图引擎深度解析——CANN的计算图优化与执行引擎卷毛的技术笔记7 小时前
告别硬编码!Spring AI Alibaba 实现 AI Agent 智能工具调用(Tool Calling)编程大师哥7 小时前
匿名函数 lambda + 高阶函数vb2008117 小时前
FastAPI APIRouteradrninistrat0r7 小时前
Java调用链MCP分析工具杨充8 小时前
1.3 浮点型数据设计灵魂meilindehuzi_a9 小时前
深入浅出数据结构:Python 字典(Dict)与集合(Set)的哈希表底层全链路追踪