我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。
最近学员群有同学问,英文论文翻译成中文的解决方案---"DeepL翻译出来的内容总是有点别扭,ChatGPT能翻译的地道一些吗?"。
正好有位刚加入的学员也在问我,之前有篇SCI论文被拒了,想翻译成中文,投在国内核心期刊试试。问娜姐有没有好用的提示词?
我在学员群调查了一下,有不少同学有需求。
平时在读一些英文论文的时候,我会用到翻译插件来一键翻译。虽然对照英文原文,能看懂意思。但是,仔细读中文译文,还是会发现不少bug:
1 英文语句相比中文句子结构更紧凑,因此翻译出来的中文译文大多是长句子,缺乏断句。而中文更习惯于状语前置,尽量避免不断气的一口气长句。
2 有些英文结构复杂的句子,比如后置的定语,从句等,译成中文会有指代不清甚至意思错误。
所以,如果是正式提交或发表的文本,比如基金项目、论文等的英文翻译,这些一键翻译的效果还是不太好,不能直接用。
ChatGPT之类的AI工具能不能翻译的更加信达雅,更符合学术规范?
既然有这么多学员有需求,再加上这事大模型确实擅长。于是我就开整了。
经过4小时调试,从晚上7点到10点,先确定方案,再对提示词各部分增删,一点点对比翻译效果,最终确定下来一套非常适合学术论文英文翻译成中文的prompt。
话不多说,以Nature杂志上一篇免疫学文章为例,来看一下DeepL的中译英和娜姐的英译中效果对比:
DeepL翻译:
自身免疫干细胞样 CD8 T 细胞群是 1 型糖尿病的诱因
娜姐的ChatGPT三步反思翻译效果:
两者翻译效果差别还是挺大的:
1 首先标题中的drives,DeepL翻译为"诱因",而ChatGPT则直译为"驱动",这里"驱动"更准确,因为"自身免疫干细胞样 CD8 T 细胞"对人体的作用机制既有正向又有负向,所以说"自身免疫干细胞样 CD8 T 细胞"是"1 型糖尿病的诱因" 不太准确;
2 "Here we followed the fate of β-cell-specific CD8 T cells in non-obese diabetic mice throughout the course of type 1 diabetes.",
DeepL的翻译是"在这里,我们跟踪了非肥胖糖尿病小鼠在整个1型糖尿病过程中β细胞特异性CD8 T细胞的命运。"
ChatGPT反思翻译的译文是:在本研究中,我们在非肥胖糖尿病(non-obese diabetic, NOD)小鼠中,跟踪了β细胞特异性CD8 T细胞在1型糖尿病整个病程中的命运。
不论是断句,还是句子逻辑性,还是学术规范化(专有名词的翻译、简称),ChatGPT都更胜一筹;
3 Pancreatic autoimmune mediators are short-lived, and stem-like autoimmune progenitors must continuously seed the pancreas to sustain β-cell destruction.
DeepL的译文是:胰腺自身免疫介质的寿命很短,而干型自身免疫祖细胞必须持续不断地向胰腺播种,以维持β细胞的破坏。
ChatGPT反思翻译的译文:胰腺自身免疫效应细胞寿命较短,必须由干细胞样自身免疫祖细胞不断地为胰腺提供种子,以维持对β细胞的破坏。
前者有一股"翻译味"---"向胰腺播种",因果逻辑关系上后者也表达更清晰。
此外,除了摘要部分,正文部分的译文也是如此,相比DeepL, ChatGPT反思翻译,除了表达更流畅,清晰,更符合学术规范。有些英文长难句,后者翻译更准确:
- TCF1 is one of the targets of canonical Wnt signalling, which maintains stemness in adult tissue stem cells, tumours, and peripheral T cells.
DeepL: TCF1是典型Wnt信号的靶标之一,它能维持成体组织干细胞、肿瘤和外周T细胞的干性. (此处的"它"是指TCF1还是Wnt信号通路?DeepL的译文看起来是TCF1,事实是指Wnt信号通路。所以,此处"它"指代错误。)
ChatGPT反思翻译的译文:TCF1是经典Wnt信号通路的靶基因,该通路在维持成人干细胞、肿瘤和外周T细胞干性中起关键作用。
- TOX has been described as a key driver of CD8 T cell exhaustion in tumours and chronic infections, settings of persistent antigen encounter.
DeepL: TOX已被描述为肿瘤和慢性感染中CD8 T细胞衰竭的关键驱动因素,也是持续遇到抗原的环境。(后半句"也是持续遇到抗原的环境"不通顺,主语指代不清。)
ChatGPT反思翻译的译文:TOX被认为是肿瘤和慢性感染中CD8 T细胞耗竭的主要驱动因子,这些情况下T细胞通常长期暴露于抗原刺激。
经过娜姐多篇文章的全文测试,在英文论文翻译为中文的场景下,ChatGPT反思翻译在学术规范化、用词精准性、和逻辑清晰性方面,都比DeepL等传统翻译工具的全文翻译要地道。基本上可以拿来直接用。