C# 实现 Word 与 TXT 文本格式互转

在现代办公自动化和数据处理流程中,经常需要在不同的文档格式之间进行转换。将 Word 文档 (.doc, .docx) 转换为纯文本 (.txt) 可以方便地提取文字内容用于数据分析、内容索引或简化分享。反之,将 TXT 文件转换为 Word 格式则能更好地利用 Word 强大的排版和格式化功能。

本文将分享如何使用 Spire.Doc for .NET 实现 TXT 文本文件与 Word 文档之间的双向转换,提供完整 C# 示例代码。

Nuget 安装Install-Package Spire.Doc

Word 转 TXT:保留结构与内容

Spire.Doc 提供 SaveToFile() 方法,可直接将加载的 Word 文档转换为纯文本,同时保留段落、换行等结构。

csharp 复制代码
using Spire.Doc;

namespace ConvertWordToText
{
    internal class Program
    {
        static void Main(string[] args)
        {
            // 加载Word文件
            Document doc = new Document();
            doc.LoadFromFile("示例.docx");

            // 保存为txt格式
            doc.SaveToFile("Word转Txt.txt", FileFormat.Txt);
            doc.Close();
        }
    }
}

📌 优势

  • 自动识别段落、换行
  • 中文不乱码(UTF-8 编码)
  • 保留原始内容结构,不丢失关键信息
  • 输出为纯文本,可直接用于日志、数据库导入

⚠️ 注意:表格、图片、样式等将被忽略,若需保留,需额外处理。

TXT 转 Word:精准重建文档

加载文本文件可用 LoadText方法,然后再次使用 SaveToFile() 方法将 TXT 内容还原为 Word 文档。

csharp 复制代码
using Spire.Doc;

namespace ConvertTextToWord
{
    internal class Program
    {
        static void Main(string[] args)
        {
            // 加载文本文件
            Document doc = new Document();
            doc.LoadText("示例.txt");

            // 保存为Word (.doc 或 .docx)
            doc.SaveToFile("Txt转Word.docx", FileFormat.Docx2016);
            doc.Close();
        }
    }
}

📌 亮点

  • 每个换行自动识别为段落
  • 保留原始文本结构,适合生成报告、通知等
  • 可进一步美化(如设置字体、标题样式)

⚠️ 限制:无法还原原Word中的表格、样式、页眉页脚,属于"文本重建"而非"格式还原"。

结语

在自动化办公中,Word 转 TXTTXT 转 Word 的高效转换是提升效率的关键环节。本文基于 Spire.Doc for .NET 提供了完整、可复用的 C# 实现方案,避免了传统方法 Microsoft.Office.Interop.Word 需依赖 Office 安装、兼容性差等问题。

相关推荐
iReachers6 小时前
.NET 单文件程序详解:从原理到实践
windows·microsoft·.net
2501_9262279410 小时前
.Net程序员就业现状以及学习路线图(五)
学习·.net
土了个豆子的15 小时前
04.事件中心模块
开发语言·前端·visualstudio·单例模式·c#
@areok@16 小时前
C++mat传入C#OpencvCSharp的mat
开发语言·c++·opencv·c#
Tiger_shl17 小时前
【.Net技术栈梳理】05-gRPC
.net
时光追逐者18 小时前
C# 哈希查找算法实操
算法·c#·哈希算法
三千道应用题19 小时前
C#语言入门详解(18)传值、输出、引用、数组、具名、可选参数、扩展方法
开发语言·c#