在处理 Word 文档翻译时,很多问题不是翻译接口造成的,而是文档结构没有被保留下来。
Word 文件里除了正文,还包含标题样式、自动编号、表格、图片、页眉页脚、目录、批注、修订和隐藏字段。翻译后文字长度变化,这些结构就可能出现连锁变化。
1. 翻译前先判断文件类型
不要只看后缀是不是 .docx。
有些 Word 文件打开后每一页都是图片,本质上还是扫描件。这类文件需要先做 OCR,再进入翻译和排版流程。
可编辑 Word 的判断方法:
- 文字能选中
- 段落能编辑
- 表格单元格能单独选中
- 图片和文本不是整页截图
如果不能选中文字,要先按扫描件处理。
2. 翻译前检查修订和批注
合同、论文和技术文件经常带修订痕迹。翻译前要先确认:
- 修订是否需要保留
- 批注是否需要翻译
- 批注作者和时间是否不要改
- 删除内容是否不参与正文翻译
如果不先处理,译文里可能混入旧版本文字或批注说明。
3. 标记不应该翻译的字段
这些内容通常不建议随意翻译:
- 产品型号
- 标准编号
- 公式
- 单位
- 邮箱和电话
- 文件路径
- 代码片段
- 品牌名和专有名词
例如 ISO 9001:2015、AB-1200、Ctrl + S 这类内容,一般要保留原样或按上下文局部处理。
4. 在原结构里替换译文
不要把整篇 Word 复制到普通翻译框,再粘回文档。这样容易丢失:
- 标题样式
- 表格列宽
- 自动编号
- 超链接
- 批注
- 目录结构
更稳定的方式是在保留原文档结构的基础上替换段落、表格和文本框内容。
5. 翻译后重点检查表格
表格是 Word 翻译后最容易出错的部分。
需要检查:
- 表头是否换行过多
- 单元格文字是否被遮挡
- 合并单元格是否错位
- 数字、金额、单位是否被误改
- 表格跨页是否自然
报价单、参数表、检测报告尤其要注意数字和字段位置。
6. 最后导出 PDF 验证
Word 编辑视图正常,不代表导出后也正常。建议翻译完成后导出 PDF,再检查:
- 页码是否连续
- 标题是否落在页尾
- 图片和图注是否分离
- 目录页码是否正确
- 打印预览是否正常
完整检查清单参考:
Word文档翻译保留格式_标题表格图片批注检查清单 -- 翻译排版大师
Word 文档翻译的关键不是只翻译文本,而是保留可编辑结构。结构保住了,后续修改、打印和交付才不会反复返工。