本文介绍如何利用 pd.crosstab 将分类变量(如顾客评分)按分组(如门店)展开为多个计数列,高效实现"一店一行、三评计数"的宽表转换,并控制列序与轴标签。 本文介绍如何利用 `pd.crosstab` 将分类变量(如顾客评分)按分组(如门店)展开为多个计数列,高效实现"一店一行、三评计数"的宽表转换,并控制列序与轴标签。在数据分析中,常需将长格式的分类计数数据(如每条记录代表一次门店评分)聚合为宽格式汇总表(如每行代表一家门店,各列分别显示 High / Medium / Low 的出现次数)。Pandas 提供了简洁高效的解决方案------pd.crosstab,它专为构建二维频数交叉表而设计。以下是一个典型场景:原始 DataFrame 包含两列 'Shop' 和 'Review',其中 'Review' 取值为 'High'、'Medium' 或 'Low',但同一店铺可能有多条评分记录。目标是生成新 DataFrame,每行唯一对应一个店铺,并新增三列分别统计该店各评分等级的数量。首先,构造示例数据:import pandas as pddata = [['store1', 'High'], ['store1', 'Medium'], ['store2', 'Low'], ['store2', 'Low']]df = pd.DataFrame(data, columns=['Shop', 'Review'])为确保输出列严格按 'High' → 'Medium' → 'Low' 顺序排列(而非默认字母序),推荐先将 'Review' 列转为有序分类类型(Categorical):df['Review'] = pd.Categorical(df['Review'], categories=['High', 'Medium', 'Low'])接着调用 pd.crosstab 进行交叉计数:result = pd.crosstab(df['Shop'], df['Review'])print(result)输出为: Zeemo AI 一款专业的视频字幕制作和视频处理工具
相关推荐
qq_334563552 小时前
C#怎么实现后台作业调度 C#如何用Quartz.NET配置Cron表达式执行定时调度作业【框架】weixin_586061462 小时前
Django怎么实现跨域请求处理_Python配置CORS中间件详解weixin_704266052 小时前
spring cloud 简单了解财经资讯数据_灵砚智能2 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年4月14日敲代码的瓦龙2 小时前
Java?泛型!!!xiaotao1312 小时前
01-编程基础与数学基石: 常用内置库DaqunChen2 小时前
PHP怎么实现单例模式_PHP常用设计模式之单例模式【方法】2301_803538952 小时前
Matplotlib 动画中多子图更新失效的解决方案ZC跨境爬虫2 小时前
纯requests+Redis实现分布式爬虫(可视化4终端,模拟4台电脑联合爬取)