思路
1.sdltm转tmx(SDL Trados Studio)
2.tmx转excel(代码/Xbench/Maxprograms/Localazy)
步骤
1.利用SDL Trados Studio打开sdltm文件
2.将选择要导出的翻译库,右键导出
3.查看tmx文件,发现tmx文件符合xml文件格式
4.利用python将tmx文件转为excel文件
代码
python
import pandas as pd
import xml.etree.ElementTree as ET
def get_text_for_tag(root):
texts = []
for element in root.iter():
if element.text:
texts.append(element.text)
if element.tail and element.tail != "\n ":
texts.append(element.tail)
return ''.join(texts)
def tmx_to_excel(tmx_file, excel_file):
tree = ET.parse(tmx_file)
root = tree.getroot()
# 初始化数据列表
data = []
# 遍历TMX文件中的每个tu(翻译单元)
for tu in root.findall('.//tu'):
seglist = tu.findall("tuv/seg")
source_text = get_text_for_tag(seglist[0])
target_text = get_text_for_tag(seglist[1])
data.append([source_text, target_text])
# 创建DataFrame
df = pd.DataFrame(data, columns=['Source', 'Target'])
# 导出为Excel文件
df.to_excel(excel_file, index=False)
# 使用示例
tmx_to_excel(r'tmx文件路径', r'xlsx文件路径')