Excel文件按照列内容进行分组

复制代码
import pandas as pd

# 读取原始Excel文件
df = pd.read_excel(r'C:\Users\1\Desktop\DamaishujuStoreProductInfo.xlsx')

# 根据SiteAbbr列内容进行分组
groups = df.groupby('SiteAbbr')

# 遍历每个分组,生成新的Excel表格
for name, group in groups:
    # 创建新的Excel文件名
    output_filename = f'C:\\Users\\1\\Desktop\\{name}.xlsx'
    
    # 保存分组数据到新的Excel文件
    group.to_excel(output_filename, index=False)
  1. 使用pandas库中的read_excel()函数读取原始Excel文件,存储在DataFrame类型的变量df中。
  2. 根据SiteAbbr列的内容对DataFrame进行分组,groups是一个以SiteAbbr列的唯一值为键,以该唯一值所对应的行为值的字典。
  3. 遍历每个分组,在指定的路径创建一个新的Excel文件名,并将分组的数据保存到新的Excel文件中。具体操作如下:
    • 通过groupby()函数后,得到了以SiteAbbr列唯一值为分组的DataFrameGroupBy对象,可以使用其.to_excel()方法将分组后的数据写入到Excel文件中;
    • 使用f-string(Python 3.6及以上版本)构造新Excel文件的路径和文件名;
    • index=False参数用于不保存DataFrame索引,只保存数据。
相关推荐
Kay_Liang10 分钟前
探究排序算法的奥秘(下):快速排序、归并排序、堆排序
java·数据结构·c++·python·算法·排序算法
禺垣11 分钟前
AdaBoost算法的原理及Python实现
人工智能·python·算法·机器学习·数据挖掘·adaboost·集成学习
xun-ming44 分钟前
Java导出带图片的Excel
java·excel·easypoi·导出·excel带图片
带娃的IT创业者1 小时前
《Python Web部署应知应会》Flask网站隐藏或改变浏览器URL:从Nginx反向代理到URL重写技术
前端·python·flask
灏瀚星空2 小时前
量化交易之数学与统计学基础2.3——线性代数与矩阵运算 | 线性方程组
笔记·python·信息可视化·数据挖掘·回归·开源·最小二乘法
素雪风华2 小时前
conda管理python环境
python·conda·pip
Theodore_10223 小时前
Python3(19)数据结构
大数据·开发语言·数据结构·python·网络爬虫
王大傻09283 小时前
python + segno 生成个人二维码
开发语言·python
alpha xu3 小时前
微软GraphRAG的安装和在RAG中的使用体会
人工智能·python·microsoft·rag·graphrag
神奇侠20243 小时前
基于tabula对pdf中多个excel进行识别并转换成word中的优化(五)
python·pdf·tabula