场景:根据某一excel表格数据中的某一列值生成多个excel表格,并以该列值作为表格名称保存。
第一步:读取数据表格。
python
import pandas as pd
# 第一行是标题,因此设置header为第二行,默认第一行值为0
df=pd.read_excel('.\\dealdata.xlsx', header=1)
第二步:查看根据那一列数据进行分组处理。数据格式及范例为
| key | name | collegevalue | year |
| 1 | zhangsan | college1 | 2000 |
|---|---|---|---|
| 2 | lisi | college2 | 2001 |
| 3 | wangwu | college3 | 2002 |
第三步:根据某一字段进行分组,并按照字段内容生成excel文件保存在此文件下,例如以collegevalue这一列分组。
python
grouped=df.groupby('collegevalue')
for name, group in grouped:
group.to_excel(f'{name}.xlsx', index=False)
第四步:查看生成的文件,在此python文件中会根据collegevalue值生成多个excel表格,表格内容与dealdata.excel表格内容完全一致,只是排版上稍微有些许差别。
结束语
目前上述代码无法对顶部标题行和底部说明行加入到学院表格中,下一篇将会进一步说明。
如果你在工作中遇到excel数据处理的问题,也可以在底部评论区留言,我会及时回复并跟新此系列文章。