Python实现XML文件转Excel

了解xml.etree.ElementTree

https://zhuanlan.zhihu.com/p/502584681?utm_id=0

实现代码

运行前请确保对应的库装好

python 复制代码
# encoding: utf-8
import os
import xml.etree.ElementTree as ET
import pandas as pd
from tqdm import tqdm


folder_path = "C:/Users/Administrator/Desktop/新建文件夹"  # 替换为你的文件夹路径
 
# 获取文件夹中的所有文件
file_list = os.listdir(folder_path)
 
# 创建一个空的DataFrame来存储所有XML文件的数据
all_data = pd.DataFrame()
 
# 使用tqdm显示进度条
for file_name in tqdm(file_list, desc="Processing files"):
    if file_name.endswith(".xml"):
        file_path = os.path.join(folder_path, file_name)
         
        # 解析XML文件
        tree = ET.parse(file_path)
        root = tree.getroot()

        # 提取XML数据并转换为DataFram
        xml_data = {}
        for element in root.iter():
            # xml_data[element.tag] = element.attrib
            xml_data.update(element.attrib)

        # print('end')
        # print(xml_data)

        df = pd.DataFrame(xml_data, index=[0])

        # 将DataFrame添加到总的数据集中
        all_data = pd.concat([all_data, df], ignore_index=True)

# 将数据保存为Excel文件
excel_file_path = "C:/Users/Administrator/Desktop/新建文件夹/2011.xlsx"  # 替换为你的输出文件路径,如:/path/to/output/file.xlsx
all_data.to_excel(excel_file_path, index=False)
print('end')
print(all_data)

print("转换完成!Excel文件已保存。")
相关推荐
曲幽15 分钟前
你的FastAPI又在服务器上“跑不起来”了?来,今天咱把打包这件事彻底聊透
linux·windows·python·docker·fastapi·web·pyinstaller·nssm·services
AI玫瑰助手17 分钟前
Python函数:局部变量与全局变量的作用域
开发语言·python·信息可视化
imDwAaY18 分钟前
机器学习入门:从感知机到逻辑回归,理解线性分类器与Softmax CS188 Note20 学习笔记
人工智能·笔记·python·学习·机器学习·逻辑回归
2601_9611940219 分钟前
2026初级会计实务教材电子版|章节讲义+习题PDF
python·考研·django·pdf·virtualenv·pygame
极客笔记Jack22 分钟前
Scanpy 富集分析实战:gseapy 从基因列表到通路解读
python
岁月宁静38 分钟前
Hermes Agent:让你的AI智能体越用越聪明
python·agent
财经资讯数据_灵砚智能1 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月29日
人工智能·python·信息可视化·自然语言处理·ai编程
触底反弹1 小时前
从数据结构到 Prompt 设计:前端工程师的 AI 时代进阶指南
javascript·人工智能·python
好好风格1 小时前
这个开源项目,把本地大模型做成会说话的 Live2D 桌宠
人工智能·python·开源
Ada's1 小时前
【计算机基础系列】python语言:环境搭建
开发语言·python