PDF和Excel表格翻译后格式乱,应该检查哪些结构

PDF 或 Excel 表格翻译后,不能只看正文是否翻出来。

表格真正容易出问题的位置,通常是结构区:

  1. 多层表头
  2. 合并单元格
  3. 数字和单位
  4. 跨页表格
  5. 备注、总计和签字栏

如果是报价单,重点看单价、数量、总价和币种;如果是检测报告,重点看检测值、标准值、单位和结果判断;如果是说明书参数表,重点看型号、规格、单位和参数是否还对应。

PDF 表格和 Excel 表格还不一样。

PDF 表格重点看识别和排版,尤其是扫描件,需要先确认 OCR 有没有把行列结构识别稳。Excel 表格则要额外看公式、引用单元格、多 sheet 和筛选结构。

我把更完整的检查顺序整理在这里:

https://fanyipaiban.com/news/pdf-table-translation-keep-format/

相关的 PDF 翻译后质量检查也可以一起看:

https://fanyipaiban.com/news/pdf-translation-quality-checklist/