如何利用ChatGPT进行翻译--通用翻译篇

背景

游戏厂商或者游戏平台在游戏出海时,经常有这样的场景:

1、游戏多地区同服,每个地区的玩家语言不同,各自都在公共频道上发言,游戏需要有一个通用的翻译工具,供玩家使用,以便知晓其它地区的玩家发言内容。

2、游戏/平台客服,每天需要处理各个地区的各种咨询和建议,而客服并不能精通每个地区的语言,也需要一个通用的翻译工具。

而在ChatGPT和一众大模型出现之前,我们通常的做法是引入一款翻译工具,比如百度翻译、谷歌翻译、AWS翻译等等。但它们都有以下缺点:

  • 费用昂贵;
  • 在游戏行业中,翻译效果一般;术语的定义有语种限制;

而ChatGPT的出现,以上的场景和缺点都可以轻松解决。

选型

基于上述所说的场景,我们需要一款价格便宜,翻译效果尚可,获取难度低的大模型。

GPT3.5 GPT4 PaLM2 文心一言 Gemini Claude2
费用(千token) $0.0010 $0.0300 $0.0005 $0.0011 公测免费,后续费用未知 $0.01102
翻译准确度
获取难度

上表的大模型都支持多语言翻译,通过对比大模型的价格、翻译准确度、获取难度可知,GPT3.5与PaLM2有较大优势。

通用模式

一般而言,通用翻译工具,更多只需要翻译能达意,能让看的人懂得要表达的意思即可。所以使用大模型进行翻译,prompt不需要太多的提示,更多是告知模型需要翻译的目标语种,和按预期格式返回。而以上大模型,除了文心一言外,其余都更适用使用英文来写prompt。以下是我让大模型将文本翻译成中文的例子:

sql 复制代码
Please translate the text into Chinese according to the following requirements  
1、Output only the translation result without interpretation.  
2、Translate to the best of your ability.

热度(temperature)使用0。至于为什么,可以看看我之前的精准翻译篇,里面有详细解释。

大模型带来的问题&解决方案

如果只按照上述的通用模式来实现翻译,在生产环境下是远远不够的,你将可能遇到以下问题

一、稳定性

翻译,作为一个C端的接口/能力,对稳定性还是有一定要求。而在实际生产环境的使用中,无论是GPT还是Google的PaLM2,服务都会偶尔不可用。针对这种情况,我们采取的是多模型互备降级,传统翻译工具兜底来达到高可用的目的。于是,整个翻译流程大致如下:

二、实时性

在实际使用的过程中,一般的待翻译文本在30字左右(均值)的长度,各大模型的响应时间都在500ms左右,基本符合C端接口要求。但建议做好超时控制,一般在3~5s内无法响应则应主动取消,进行降级翻译。

三、准确性

如果你有使用大模型的经历,那么必然经历过大模型不按预期返回的场景。举个例子,在我们这次的场景中,是翻译,现在有一个中译英场景,待翻译内容为[生成序列号]。有些大模型就可能没有按照预定的提示词进行翻译,而是真的给你生成了许多随机的序列号。而类似的情况还有许多许多,你不能控制翻译的时候,待翻译内容的输入。那么针对这种情况,我采用的是翻译后纠错。

什么意思?使用开源工具(github.com/pemistahl/lingua-go),对翻译结果进行语种判定,然后与预期语种比对,如果不一致,则进行降级翻译处理。于是,整个翻译流程又变成:

四、调用频率

几乎所有的大模型都有调用频率限制,在上生产环境前,都需要对业务量进行评估,与模型供应商协商好。

五、安全限制

所有的大模型都有自己的一套安全限制,即当输入的内容不符合规定时,强制终止。一般都有参数配置,详情需要与模型供应商协商好。同时,程序上需要正确的捕获安全限制终止,并进行降级。

细心的人可能已经发现,以上五个问题,不仅仅适用于翻译场景,其实也适用所有使用大模型的场景。

效果

以上的通用翻译方案,在37手游内部使用良好。在某个游戏项目中,实现翻译成本降本80%的惊人效果。

此文章来自于37手游------洪智彬
相关推荐
美狐美颜sdk1 小时前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
DeepSeek-大模型系统教程2 小时前
推荐 7 个本周 yyds 的 GitHub 项目。
人工智能·ai·语言模型·大模型·github·ai大模型·大模型学习
郭庆汝2 小时前
pytorch、torchvision与python版本对应关系
人工智能·pytorch·python
小雷FansUnion4 小时前
深入理解MCP架构:智能服务编排、上下文管理与动态路由实战
人工智能·架构·大模型·mcp
资讯分享周4 小时前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
叶子爱分享5 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜5 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习
一只鹿鹿鹿5 小时前
信息化项目验收,软件工程评审和检查表单
大数据·人工智能·后端·智慧城市·软件工程
张较瘦_5 小时前
[论文阅读] 人工智能 | 深度学习系统崩溃恢复新方案:DaiFu框架的原位修复技术
论文阅读·人工智能·深度学习
cver1235 小时前
野生动物检测数据集介绍-5,138张图片 野生动物保护监测 智能狩猎相机系统 生态研究与调查
人工智能·pytorch·深度学习·目标检测·计算机视觉·目标跟踪