【SDL Trados Studio】sdltm格式转excel

思路

1.sdltm转tmx(SDL Trados Studio)

2.tmx转excel(代码/Xbench/Maxprograms/Localazy)

步骤

1.利用SDL Trados Studio打开sdltm文件

2.将选择要导出的翻译库,右键导出

3.查看tmx文件,发现tmx文件符合xml文件格式

4.利用python将tmx文件转为excel文件

代码

python 复制代码
import pandas as pd
import xml.etree.ElementTree as ET
def get_text_for_tag(root):
    texts = []
    for element in root.iter():
        if element.text:
            texts.append(element.text)
        if element.tail and element.tail != "\n      ":
            texts.append(element.tail)
    return ''.join(texts)
def tmx_to_excel(tmx_file, excel_file):
    tree = ET.parse(tmx_file)
    root = tree.getroot()
    # 初始化数据列表
    data = []
    # 遍历TMX文件中的每个tu(翻译单元)
    for tu in root.findall('.//tu'):
        seglist = tu.findall("tuv/seg")
        source_text = get_text_for_tag(seglist[0])
        target_text = get_text_for_tag(seglist[1])
        data.append([source_text, target_text])
    # 创建DataFrame
    df = pd.DataFrame(data, columns=['Source', 'Target'])
    # 导出为Excel文件
    df.to_excel(excel_file, index=False)
# 使用示例
tmx_to_excel(r'tmx文件路径', r'xlsx文件路径')

结果

相关推荐
一根稻草君26 分钟前
利用poi写一个工具类导出逐级合并的单元格的Excel(通用)
java·excel
鱼钓猫的小鱼干3 小时前
table 表格转成 excell 导出
前端·vue·excel
域智盾-运营小韩4 小时前
excel技巧:excel文件怎么加密防止泄密?加密Excel文件的四种方法
excel
是小崔啊11 小时前
开源轮子 - EasyExcel02(深入实践)
java·开源·excel
龙虎榜小红牛系统1 天前
使用Excel制作通达信自定义“序列数据“
excel·股票·通达信
Py办公羊大侠1 天前
Excel批量设置行高,Excel表格设置自动换行后打印显示不全,Excel表格设置最合适的行高后打印显示不全,完美解决方案!!!
python·excel·打印·openpyxl·自动换行·显示不全
SixCandy1 天前
EXCEL使用宏实现筛选重复项并对该行进行填充内容的操作
办公软件·excel··wps
你走以后1 天前
excel中如何筛选一列中重复的内容,相同的内容只保留一次
excel
热心市民运维小孙2 天前
Ubuntu重命名默认账户
linux·ubuntu·excel
又蓝2 天前
使用 Python 操作 Excel 表格
开发语言·python·excel