Python实现XML文件转Excel

了解xml.etree.ElementTree

https://zhuanlan.zhihu.com/p/502584681?utm_id=0

实现代码

运行前请确保对应的库装好

python 复制代码
# encoding: utf-8
import os
import xml.etree.ElementTree as ET
import pandas as pd
from tqdm import tqdm


folder_path = "C:/Users/Administrator/Desktop/新建文件夹"  # 替换为你的文件夹路径
 
# 获取文件夹中的所有文件
file_list = os.listdir(folder_path)
 
# 创建一个空的DataFrame来存储所有XML文件的数据
all_data = pd.DataFrame()
 
# 使用tqdm显示进度条
for file_name in tqdm(file_list, desc="Processing files"):
    if file_name.endswith(".xml"):
        file_path = os.path.join(folder_path, file_name)
         
        # 解析XML文件
        tree = ET.parse(file_path)
        root = tree.getroot()

        # 提取XML数据并转换为DataFram
        xml_data = {}
        for element in root.iter():
            # xml_data[element.tag] = element.attrib
            xml_data.update(element.attrib)

        # print('end')
        # print(xml_data)

        df = pd.DataFrame(xml_data, index=[0])

        # 将DataFrame添加到总的数据集中
        all_data = pd.concat([all_data, df], ignore_index=True)

# 将数据保存为Excel文件
excel_file_path = "C:/Users/Administrator/Desktop/新建文件夹/2011.xlsx"  # 替换为你的输出文件路径,如:/path/to/output/file.xlsx
all_data.to_excel(excel_file_path, index=False)
print('end')
print(all_data)

print("转换完成!Excel文件已保存。")
相关推荐
鸽芷咕1 分钟前
DrissionPage 成 CANN 仓库爆款自动化工具:背后原因何在?
运维·python·自动化·cann
爱学习的阿磊3 分钟前
使用Fabric自动化你的部署流程
jvm·数据库·python
少云清23 分钟前
【金融项目实战】7_接口测试 _代码实现接口测试(重点)
python·金融项目实战
深蓝电商API23 分钟前
爬虫IP封禁后的自动切换与检测机制
爬虫·python
m0_5500246325 分钟前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
B站_计算机毕业设计之家1 小时前
豆瓣电影数据采集分析推荐系统 | Python Vue Flask框架 LSTM Echarts多技术融合开发 毕业设计源码 计算机
vue.js·python·机器学习·flask·echarts·lstm·推荐算法
渣渣苏1 小时前
Langchain实战快速入门
人工智能·python·langchain
lili-felicity1 小时前
CANN模型量化详解:从FP32到INT8的精度与性能平衡
人工智能·python
数据知道1 小时前
PostgreSQL实战:详解如何用Python优雅地从PG中存取处理JSON
python·postgresql·json
ZH15455891311 小时前
Flutter for OpenHarmony Python学习助手实战:面向对象编程实战的实现
python·学习·flutter