在现代办公自动化和数据处理流程中,经常需要在不同的文档格式之间进行转换。将 Word 文档 (.doc, .docx) 转换为纯文本 (.txt) 可以方便地提取文字内容用于数据分析、内容索引或简化分享。反之,将 TXT 文件转换为 Word 格式则能更好地利用 Word 强大的排版和格式化功能。
本文将分享如何使用 Spire.Doc for .NET 实现 TXT 文本文件与 Word 文档之间的双向转换,提供完整 C# 示例代码。
Nuget 安装 :Install-Package Spire.Doc
Word 转 TXT:保留结构与内容
Spire.Doc 提供 SaveToFile()
方法,可直接将加载的 Word 文档转换为纯文本,同时保留段落、换行等结构。
csharp
using Spire.Doc;
namespace ConvertWordToText
{
internal class Program
{
static void Main(string[] args)
{
// 加载Word文件
Document doc = new Document();
doc.LoadFromFile("示例.docx");
// 保存为txt格式
doc.SaveToFile("Word转Txt.txt", FileFormat.Txt);
doc.Close();
}
}
}
📌 优势:
- 自动识别段落、换行
- 中文不乱码(UTF-8 编码)
- 保留原始内容结构,不丢失关键信息
- 输出为纯文本,可直接用于日志、数据库导入
⚠️ 注意:表格、图片、样式等将被忽略,若需保留,需额外处理。
TXT 转 Word:精准重建文档
加载文本文件可用 LoadText
方法,然后再次使用 SaveToFile()
方法将 TXT 内容还原为 Word 文档。
csharp
using Spire.Doc;
namespace ConvertTextToWord
{
internal class Program
{
static void Main(string[] args)
{
// 加载文本文件
Document doc = new Document();
doc.LoadText("示例.txt");
// 保存为Word (.doc 或 .docx)
doc.SaveToFile("Txt转Word.docx", FileFormat.Docx2016);
doc.Close();
}
}
}
📌 亮点:
- 每个换行自动识别为段落
- 保留原始文本结构,适合生成报告、通知等
- 可进一步美化(如设置字体、标题样式)
⚠️ 限制:无法还原原Word中的表格、样式、页眉页脚,属于"文本重建"而非"格式还原"。
结语
在自动化办公中,Word 转 TXT 与 TXT 转 Word 的高效转换是提升效率的关键环节。本文基于 Spire.Doc for .NET 提供了完整、可复用的 C# 实现方案,避免了传统方法 Microsoft.Office.Interop.Word
需依赖 Office 安装、兼容性差等问题。