基于GPTs个性化定制SCI论文专业翻译器

1. 什么是GPTs

GPTs是OpenAI在2023年11月6日开发者大会上发布的重要功能更新,允许用户根据特定需求定制自己的ChatGPT模型。

Introducing GPTs 官方介绍页面https://openai.com/blog/introducing-gpts

在原有自定义ChatGPT 的流程中,首先需要自己编制prompts和各种指令 ,每次新对话都需要重新复制粘贴 到ChatGPT对话中,用户操作繁复 。OpenAi为了应对不断增长的定制化功能的需求,终于推出了GPTs,以允许用户创建特定用途定制ChatGPT版本

目前,ChatGPT Plus 用户已经可以使用GPTs创建并分享个性化的My GPTs模型 。自定义的GPTs模型有两种配置方式,包括:

(1)通过自然语言与GPT Builder交流 :GPT Builder会对于自定义GPT的名字、头像(可以由DALL·E生成)、希望实现的功能等进行提问,根据用户回答在GPT Configure中生成对应的NameDescriptionInstructionsConversation starters

(2)直接自定义Configure :包括GPT名称(Name)功能描述(Description)预定义指令(Instructions)用户首次使用可以参考的提示语(Conversation starters)知识库(Knowledge, 用户自主上传文档)增强功能(网页搜索、AI 绘画DALL·E、代码分析器)、其他拓展(Action: GPT retrieve information or take actions outside of ChatGPT)、隐私设置等。

图为自然语言(左) 与**直接定义(右)**两种方式自定义GPTs。

2. 实际应用:创建一个基于GPTs开发专业的中英文翻译器

下面将根据本人的实际需求出发,创建一个基于GPTs的适用于自己所在专业的中英文翻译器,翻译器中集成了中英互译对照表,并具有一定的专业理论与专业知识。最终效果如下图所示。

2.1 专业中英文翻译的需求

目前市面上场景的机器翻译产品均不能很好满足需求。通用翻译器,例如百度翻译谷歌翻译,其对于专业词汇翻译不准确;DeepL翻译器的术语表需要高级付费订阅,并且在今年才新加入中英术语对照功能;SDL Trados面向专业译者,定义术语表等功能使用复杂;原有chatGPT产品,每个新对话均需要将术语表和指令重新键入一次,重复性操作多,非常繁琐。因此,使用新发布的用户自定义GPTs模型,将专业术语和专业知识整合,并可以检索专业理论和语料库,能够充分满足需求。

笔者是轨道交通专业,希望创建一个基于GPT的英文学术论文翻译器,便于将中文手稿转换至专业的英文论文形式 。在中英转换过程中,需要保证术语翻译的准确性。此外,自定义的GPT模型还应具有英文论文翻译至中文的能力,便于我阅读英文文献。

打开chatGPT用户界面,在左上角Explore 中具有Create a GPT的菜单。

点击后可以选择是基于自然语言 创建的Create模式 ,或者直接定义好prompts的Configure模式两者之间可以随时切换使用。

在Create模式中,通过与GPT Builder对话交流所定义的GPT,可以自动填充至对应的Configure内容

因此,可以先使用Create模式 创建大体框架,再检查Configure模式修缮定义细节。

2.2 定义GPT模型

以下InstructionsPrompts 均是使用英文进行的定义,会给出对应的中文翻译和如此定义的原因。

1) Name(GPT模型名称)

Railway academic translator

参考翻译:铁路学术翻译器

2)Description(出现在名称下面的功能描述)

Translates papers, prioritizing academic writing standards.

参考翻译:翻译论文,优先考虑学术写作标准。

3)Instructions(GPTs指令)

The Railway academic translator is designed to translate railway transportation academic papers between Chinese and English, prioritizing academic writing standards and terminology accuracy for SCI journals. It retains original Chinese or English names for personal names. In cases of ambiguous or unclear text, it seeks further information from the user or offers multiple translation interpretations. It utilizes a detailed Chinese-English terminology glossary for precise and reliable translations in this field. An important update is to preserve original citations, such as [1], in the translated content, ensuring they are not altered or formatted incorrectly. This allows for easy reference and comparison with the original document.

参考翻译:Railway academic translator 旨在将铁路运输领域的学术论文在中文和英文之间进行翻译,优先考虑符合SCI期刊的学术写作标准和术语准确性。它保留原文中的中文或英文个人名字。在文本含糊不清或不明确的情况下,它会向用户寻求更多信息或提供多种翻译解释。这款翻译器使用详细的中英术语对照表,以确保在此领域内进行精确可靠的翻译。一个重要的更新是保留原始文献中的引用,如[1],以确保它们在翻译内容中不被更改或格式化错误。这样可以方便地与原始文档进行参照和比较。

注意:

a) 保留原文中的中文或英文个人名字

为了便于根据原名进行论文检索,这要求在汉译英之前的中文稿件中也同时保持英文名称书写

b) 在文本含糊不清或不明确的情况下会向用户寻求更多信息

由于术语表可能不够完整,因此当出现让chatGPT对于术语翻译出现困惑时,能够询问用户请求给予更详细的解释

c) 保留原始文献中的引用,如[1]

GPTs目前具有网页搜索功能,会返回带有引用符号的文本链接,这可能与英文论文写作中的引用发生富文本形式类型上的冲突,而将原文的引用删除。需要通过此Prompts保留原论文中的引用。

4)Conversation starters(用于提示用户,一键提问)

笔者撰写了四条:

  • Please enter the paragraph you want to translate.
  • 请键入希望翻译至英文的中文论文段落
  • Do you need a translation for academic terms?
  • 需要在非母语英文学术写作中获得帮助吗?

5) Knowledge(知识库,用于GPTs在回答问题前的检索)

Conversations with your GPT may include file contents. Files can be downloaded when code interpeter is enabled. 与GPT的对话可以包括文件内容。当启用code interpeter程序时,可以下载文件。

用户自定义的文档,支持各种常见的文本文档、电子表格、演示文档等格式,每个用户单文件上限500MB,一次最多上传10个文件,每个用户总文件上限为10GB。

具体规定请参考:
ChatGPT上传文件相关问题 | OpenAI Help Centerhttps://help.openai.com/en/articles/8555545-uploading-files-with-advanced-data-analysis-in-chatgpt实际使用过程中,Word、PDF、CSV等均可以识别使用。但是,当文档内容超过数十MB时,检索速度就会比较长(可能持续数十秒)。因此,在使用时注意知识库的精简和重点突出

笔者上传了两份文件,分别是我自己整理的中英文对照表word文档 ,和一份本专业领域的文献综述 。我上传的专业名词术语库是使用自然语言定义的。

如上图所示,自定了专业术语表(左),也上传了专业相关的文献综述文档(右)。

6) Capabilities

根据需要选择是否需要网页检索与图片生成功能。

  • Web Browsing
  • DALL·E Image Generation

在完成上述定义后,右上角可以选择是否公开此GPT(Public)。

每次修改Configure之后,会提示需要Update模型

3. 使用测试

返回chatGPT初始界面,选择Explode,进入自定义的My GPTs陈列区。

单击对应的模型即可使用。

3.1 中文论文翻译至英文

找了一篇很久之前下载的论文摘要部分,复制段落给My GPTs,并将其翻译为英文。

翻译准确,术语使用规范。中英文对应较好。由于语言润色暂时不在此GPTs考虑范畴内,因此可以判断此GPTs已经优秀的完成了任务。

作为对比,给出某度翻译的结果,++不准确或者错误的翻译使用下划线表示++ 。并且,通读下来译文的质量对比也是一目了然。

++Independent rotating wheel++ is the key technology to realize 100%++low floor truck++ . Unlike ++rigid wheelsets++ , after the left and right wheels are decoupled, the independently rotating wheels no longer have the ability of ++linear alignment++ and curve guidance, which hinders the application of independently rotating wheels. ... Taking the actual research object as an example, this paper ++constructs++ the SIMPACK dynamic model of the independent rotating wheel, and simulates the straight line ++neutral energy++ and curve guidance performance of the independent rotating wheel in SIMPACK. The simulation results show that the bogie with independent rotating wheels does not have the ability of ++linear alignment++ and curve guidance. PI control, LQG control and ++μ++ Based on three control strategies, the SIMPACK dynamic model of the vehicle with independent rotating wheels is established. Then a ++co simulation++ model is established. The simulation results show that the three control strategies can significantly improve the ++straight alignment++ and curve guidance performance of the independently rotating wheel. From the perspective of control effect, the control effect of PI controller and LQG controller is ++equivalent++ . The difference is that the ++control process++ of PI controller is smoother and the lateral displacement curve is smoother. Under the action of LQG controller, the independently rotating wheels can quickly return to the ++track center++ after ++leaving the track curve++ . ++μ The integrated controller++ can make the independently rotating wheels return to the center of the ++track++, but it takes a long time.

3.2 英文SCI论文翻译至中文

从笔者研究领域的一篇SCI论文PDF文档之中复制一段,让其翻译为中文。

中文翻译结果如下图所示。总体翻译准确,易于理解,并很好保留了论文的原意。其中,"重新附着控制"对应的re-adhesion control没有出现在术语表之中,因此翻译不准确,可以通过术语表的修订解决此问题。

作为对比,某度翻译无法实现自动去除PDF复制出来的分行(当然可以使用知云翻译器等方式自动整理段落)。整理段落后,虽然整体上能够传递给读者大致的内容信息,但是诸多术语依然翻译的不准确。当然,百度推出的AI大模型翻译可能相比于传统机器翻译有所改善,这需要更多的测试,不做展开。

3.3 专业问题询问

询问专业问题,默认调用了Bing搜索,文章来源主要是ScienceDirect、SPRINGER LINK等数据库。

可以通过对话指定GPTs从知识库中搜索问题答案。当然,由于术语表定义还不够完善,以下出现了部分翻译的纰漏。但是主要回答是比较全面的,可以充当一个简便的学术论文总结工具

4. 结语(由chatGPT总结和撰写)

GPTs的推出预示着定制化智能服务的无限可能。通过本文的介绍和实践案例,我们已经看到了基于GPTs的个性化定制专业翻译器提高翻译效率精确度便捷性 方面的显著优势。定制化的ChatGPT模型使得专业翻译不再受限于通用翻译工具的局限性,能够更精准地处理专业术语和复杂语境 。通过集成了先进的网页搜索和AI绘图功能,使得翻译过程更为全面和生动 。更重要的是,用户可以根据自己的专业需求和喜好,定制独一无二的GPT模型 ,这不仅提高了工作效率 ,也增加了个性化体验。当然,我们也应意识到,这项技术仍处于发展阶段,在处理极其复杂的语境或特定的专业知识时,可能还需人工干预以确保翻译的准确性。

展望未来,随着技术的不断完善和用户体验的进一步优化,基于GPTs的个性化定制专业翻译器将在更多领域发挥巨大作用,不仅限于学术翻译,还可能延伸至商务、法律等多个专业领域。这将极大地推动人工智能在语言处理领域的应用,开启全新的翻译时代。在这个充满挑战与机遇的新时代,我们期待GPTs个性化定制专业翻译器为我们带来更多的惊喜和便利,共同探索人工智能与语言艺术的无限可能。

#SCI论文 #chatGPT #人工智能 #GPT-4 #机器翻译 #AI #英汉互译 #语料库 #轨道交通

相关推荐
海棠AI实验室2 分钟前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
hunteritself4 分钟前
AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!
人工智能·gpt·chatgpt·github·openai·copilot
IT古董1 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
centurysee1 小时前
【最佳实践】Anthropic:Agentic系统实践案例
人工智能
mahuifa1 小时前
混合开发环境---使用编程AI辅助开发Qt
人工智能·vscode·qt·qtcreator·编程ai
四口鲸鱼爱吃盐1 小时前
Pytorch | 从零构建GoogleNet对CIFAR10进行分类
人工智能·pytorch·分类
蓝天星空1 小时前
Python调用open ai接口
人工智能·python
睡觉狂魔er1 小时前
自动驾驶控制与规划——Project 3: LQR车辆横向控制
人工智能·机器学习·自动驾驶
scan7241 小时前
LILAC采样算法
人工智能·算法·机器学习
leaf_leaves_leaf2 小时前
win11用一条命令给anaconda环境安装GPU版本pytorch,并检查是否为GPU版本
人工智能·pytorch·python