Python 高效实现 Excel 转 TXT 文本

在数据处理场景中,将Excel文件转换为纯文本(TXT)格式便成为了一个常见的需求。传统的手动复制粘贴,不仅效率低下,更容易因格式不兼容、数据量庞大而引发错误。本文将解析如何通过 Spire.XLS for Python 实现 Excel 转 TXT 的高效、无依赖操作,提升数据处理效率和灵活性。

安装指令:pip install spire.xls​​

免费版:​​pip install spire.xls.free​​

基础示例:单工作表 Excel 转 TXT

以下是将一个 Excel 文件中的第一个工作表转换为 TXT 的完整步骤:

1. 加载并读取Excel文件

python 复制代码
from spire.xls import *
from spire.xls.common import *

workbook = Workbook()
workbook.LoadFromFile("示例.xlsx")

2. 执行转换并保存

python 复制代码
sheet = workbook.Worksheets[0]
sheet.SaveToFile("output.txt", "\t", Encoding.get_UTF8())

参数说明

参数类型 示例值 描述
分隔符 \t (制表符) 定义 TXT 文件中各列数据之间的分隔方式,也可使用逗号 ,、分号 ; 等。
编码方式 Encoding.get_UTF8()(国际通用编码) 指定文本文件的编码格式,推荐使用 UTF-8 以保证中文等字符正常显示。

进阶处理:多工作表分别导出为 TXT

如果你的 Excel 文件包含多个工作表,并且希望将每个工作表保存为单独的 TXT 文件,可以使用以下代码:

python 复制代码
from spire.xls import *
from spire.xls.common import *

def excel_sheets_to_txt(input_file, output_folder, delimiter="\t"):
  
    # 创建Workbook对象
    workbook = Workbook()
    # 加载Excel文件
    workbook.LoadFromFile(input_file)
        
    # 遍历所有工作表
    for i in range(workbook.Worksheets.Count):
        sheet = workbook.Worksheets[i]
            
        # 构建输出文件路径
        output_file = f"sheet_{i+1}_{sheet.Name}.txt"
        output_path = os.path.join(output_folder, output_file)
            
        # 将工作表内容保存为TXT文件
        sheet.SaveToFile(output_path, delimiter, Encoding.get_UTF8())

Excel 转 TXT 在自动化流程中的应用

将 Excel 转换为 TXT 不仅是格式的简单转换,更是实现数据自动化流程的重要环节。结合 Spire.XLS for Python,可轻松构建以下应用:

  • 自动化报告生成: 从 Excel 模板中提取数据,生成纯文本格式的报告摘要,方便邮件发送或系统集成。
  • 数据清洗与预处理: 将复杂格式的 Excel 数据转换为 TXT,作为其他数据分析工具(如Spark、Hadoop)的输入源,进行更深层次的处理。
  • 配置管理: 将 Excel 中维护的系统配置、参数表等导出为 TXT 格式,便于脚本直接读取,同时更适合使用 Git 等工具进行版本管理。

通过以上方法与示例,您可以快速掌握使用 Python 实现 Excel 到 TXT 的高效转换。该方案不仅提升了数据导出效率,也为后续的数据集成与自动化处理奠定了可靠基础。