利用python批量读取大量Excel表格文件中指定内容并汇总

工作中出现需要从大量Excel表格文件中读取指定单元格内容并汇总到一个表格中。上网搜索一下,利用Python的pandas模块可以快速实现。openpyxl也可以,不过为了快速,以能搜到的形成代码为优先。

简单修改别人代码,实现如下。

python 复制代码
import os
import pandas as pd

or_path = "D:/xlsx"
re_path = "D:/results"

result_df = pd.DataFrame()

# 因为这个例子里,Excel文件独立在不同文件夹中,所以需要遍历所有子目录
for root, dirs, files in os.walk(or_path):
    for file in files:
        # 只处理指定文件
        if !file.endswith(".xlsx"):
            continue

        read_xls = pd.ExcelFile(os.path.join(root, file))

        # 例子中,每个文件有多个sheet,需要遍历每个sheet
        for sheetname in read_xls.sheet_name:
            # 通过sheet名字读取表格内容
            df = read_xls.parse(sheetname, header=None)
            # 通过values函数可以读取单元格内容
            # 通过Data函数可以构建表格
            read_df = pd.Data({'name':[df.values[2, 1]], 'age':[df.values[3, 1]]})

            # 拼接表格
            result_df = pd.concat([result_df, read_df])

# 输出汇总到文件
result_df.to_csv(os.path.join(re_path, "result.csv"), index = false)

测试没有问题。

相关推荐
子午1 分钟前
【2026计算机毕设~AI项目】鸟类识别系统~Python+深度学习+人工智能+图像识别+算法模型
图像处理·人工智能·python·深度学习
m0_706653233 分钟前
模板编译期排序算法
开发语言·c++·算法
历程里程碑4 分钟前
Linxu14 进程一
linux·c语言·开发语言·数据结构·c++·笔记·算法
不当菜虚困9 分钟前
windows下HSDB导出class文件报错【java.io.IOException : 系统找不到指定的路径。】
java·开发语言
lsx20240612 分钟前
Vue.js 循环语句
开发语言
流㶡12 分钟前
网络爬虫库与robots.txt规则
python·网络爬虫
m0_5613596712 分钟前
嵌入式C++加密库
开发语言·c++·算法
2301_7887560616 分钟前
Python在2024年的主要趋势与发展方向
jvm·数据库·python
j4455661120 分钟前
C++中的职责链模式实战
开发语言·c++·算法
m0_6860416124 分钟前
实时数据流处理
开发语言·c++·算法