python脚本处理excel文件

1.对比perl和python

分别尝试用perl和python处理excel文件,发现perl的比较复杂,比如说read excel就有很多方式

Spreadsheet::Read

use Spreadsheet::ParseExcel

不同的method,对应的取sheet的cell方式也不一样。更复杂的是处理含有中文内容的Excel。用perl目前没有成功过。

对于python来说就比较简单,目前使用openpyxl库,处理起来清晰明了

2.python处理excel实例

下面给出一个python处理Excel的实例

用python完成两个excel合并,要求如下:

  1. 24xiaoxue.xlsx有A-G列,24zhongxue.xlsx有A-G列

2.用24zhongxue.xlsx的D列匹配24xiaoxue.xlsx的D列,如果有相同项,将24xiaoxue.xlsx相同项所在行添加到24zhongxue.xlsx行尾,并输出到新的excel

3.支持中文内容

编码声明需要放在文件的第一行或第二行,一般使用 # -*- coding: 编码格式 -*- 这种形式。常见的编码格式有 utf-8gbkgb2312 等。

python 复制代码
# -*- coding: gb2312 -*- #for 中文支持
import openpyxl

# 定义文件路径
file1 = '24zhongxue - 副本.xlsx'  # 小学文件
file2 = '24xiaoxue - 副本.xlsx' # 中学文件
#file1 = 'xxxx.xlsx'  # 小学文件
#file2 = 'xxxx.xlsx' # 中学文件
output_file = 'merged_result.xlsx' # 输出文件

# 加载两个Excel文件
wb1 = openpyxl.load_workbook(file1)
wb2 = openpyxl.load_workbook(file2)

# 获取第一个工作表
ws1 = wb1.active
ws2 = wb2.active

# 创建一个新的工作簿用于保存结果
wb_result = openpyxl.Workbook()
ws_result = wb_result.active

# 将24zhongxue.xlsx的标题行复制到新工作簿
for col in range(1, 8):  # A-G列
    for row in range(1,ws2.max_row+1):
        ws_result.cell(row=row, column=col).value = ws2.cell(row=row, column=col).value

# 创建一个字典,用于存储24xiaoxue.xlsx中D列的值和对应的行
match_dict = {}
for row in range(1, ws1.max_row + 1):  # 从第1行开始
    key = ws1.cell(row=row, column=4).value  # D列的值
    if key:
        match_dict[key] = row

# 遍历24zhongxue.xlsx的D列,查找匹配项
row_count = 1  # 新工作簿的行计数器
for row in range(1, ws2.max_row + 1):  # 从第1行开始
    key = ws2.cell(row=row, column=4).value  # D列的值
    if key and key in match_dict:
        # 如果找到匹配项,将24xiaoxue.xlsx中匹配的行复制到新工作簿
        matched_row = match_dict[key]
        for col in range(1, 8):  # A-G列
            ws_result.cell(row=row, column=col+10).value = ws1.cell(row=matched_row, column=col).value
        row_count += 1
    else:
        # 如果没有找到匹配项,将24zhongxue.xlsx的当前行复制到新工作簿
        #for couse Spreadsheet::ParseExcell in range(1, 8):  # A-G列
        #    ws_result.cell(row=row_count, column=col).value = ws2.cell(row=row, column=col).value
        row_count += 1

# 保存结果到新的Excel文件
wb_result.save(output_file)

print(f"合并完成,结果已保存到 {output_file}")
相关推荐
Johny_Zhao11 小时前
CentOS Stream 8 高可用 Kuboard 部署方案
linux·网络·python·网络安全·docker·信息安全·kubernetes·云计算·shell·yum源·系统运维·kuboard
站大爷IP12 小时前
精通einsum():多维数组操作的瑞士军刀
python
站大爷IP12 小时前
Python与MongoDB的亲密接触:从入门到实战的代码指南
python
Roc-xb13 小时前
/etc/profile.d/conda.sh: No such file or directory : numeric argument required
python·ubuntu·conda
世由心生14 小时前
[从0到1]环境准备--anaconda与pycharm的安装
ide·python·pycharm
猛犸MAMMOTH15 小时前
Python打卡第54天
pytorch·python·深度学习
梓羽玩Python15 小时前
12K+ Star的离线语音神器!50MB模型秒杀云端API,隐私零成本,20+语种支持!
人工智能·python·github
成都犀牛15 小时前
LangGraph 深度学习笔记:构建真实世界的智能代理
人工智能·pytorch·笔记·python·深度学习
終不似少年遊*15 小时前
【数据可视化】Pyecharts-家乡地图
python·信息可视化·数据挖掘·数据分析·数据可视化·pyecharts
FL162386312916 小时前
[windows工具]PDFOCR识别导出Excel工具1.1版本使用教程及注意事项
windows·excel