C# 实现 Word 与 TXT 文本格式互转

在现代办公自动化和数据处理流程中,经常需要在不同的文档格式之间进行转换。将 Word 文档 (.doc, .docx) 转换为纯文本 (.txt) 可以方便地提取文字内容用于数据分析、内容索引或简化分享。反之,将 TXT 文件转换为 Word 格式则能更好地利用 Word 强大的排版和格式化功能。

本文将分享如何使用 Spire.Doc for .NET 实现 TXT 文本文件与 Word 文档之间的双向转换,提供完整 C# 示例代码。

Nuget 安装Install-Package Spire.Doc

Word 转 TXT:保留结构与内容

Spire.Doc 提供 SaveToFile() 方法,可直接将加载的 Word 文档转换为纯文本,同时保留段落、换行等结构。

csharp 复制代码
using Spire.Doc;

namespace ConvertWordToText
{
    internal class Program
    {
        static void Main(string[] args)
        {
            // 加载Word文件
            Document doc = new Document();
            doc.LoadFromFile("示例.docx");

            // 保存为txt格式
            doc.SaveToFile("Word转Txt.txt", FileFormat.Txt);
            doc.Close();
        }
    }
}

📌 优势

  • 自动识别段落、换行
  • 中文不乱码(UTF-8 编码)
  • 保留原始内容结构,不丢失关键信息
  • 输出为纯文本,可直接用于日志、数据库导入

⚠️ 注意:表格、图片、样式等将被忽略,若需保留,需额外处理。

TXT 转 Word:精准重建文档

加载文本文件可用 LoadText方法,然后再次使用 SaveToFile() 方法将 TXT 内容还原为 Word 文档。

csharp 复制代码
using Spire.Doc;

namespace ConvertTextToWord
{
    internal class Program
    {
        static void Main(string[] args)
        {
            // 加载文本文件
            Document doc = new Document();
            doc.LoadText("示例.txt");

            // 保存为Word (.doc 或 .docx)
            doc.SaveToFile("Txt转Word.docx", FileFormat.Docx2016);
            doc.Close();
        }
    }
}

📌 亮点

  • 每个换行自动识别为段落
  • 保留原始文本结构,适合生成报告、通知等
  • 可进一步美化(如设置字体、标题样式)

⚠️ 限制:无法还原原Word中的表格、样式、页眉页脚,属于"文本重建"而非"格式还原"。

结语

在自动化办公中,Word 转 TXTTXT 转 Word 的高效转换是提升效率的关键环节。本文基于 Spire.Doc for .NET 提供了完整、可复用的 C# 实现方案,避免了传统方法 Microsoft.Office.Interop.Word 需依赖 Office 安装、兼容性差等问题。

相关推荐
齐鲁大虾7 小时前
新人编程语言选择指南
javascript·c++·python·c#
wenha7 小时前
踩坑记录:UTF-8、UTF-8-BOM 与 GB2312 读取的乱码真相
utf-8·.net·编码·utf-8-bom
加号38 小时前
【C#】 WebAPI 接口设计与实现指南
开发语言·c#
unicrom_深圳市由你创科技8 小时前
上位机开发常用的语言 / 框架有哪些?
c++·python·c#
xiaoshuaishuai811 小时前
C# ZLibrary数字资源分发
开发语言·windows·c#
Eiceblue12 小时前
C# 实现 XLS 与 XLSX 格式双向互转(无需依赖 Office)
开发语言·c#·visual studio
aini_lovee13 小时前
基于C#的三菱PLC串口通信实现方案
服务器·网络·c#
光泽雨13 小时前
c#MVVM中的消息通知机制
服务器·c#
江沉晚呤时14 小时前
C# 整型溢出处理机制:checked 与 unchecked 上下文解析
c#·.net
余衫马15 小时前
在 Windows 服务中托管 ASP.NET Core Web API (.net6)
运维·windows·后端·asp.net·.net