第二期书生·浦语大模型实战营优秀项目一览

书生·浦语社区于 2023 年年底正式推出了书生·浦语大模型实战营系列活动,至今已有两期五批次同学参加大模型学习、实战,线上课程累计学习超过 10 万人次。

实战营特设项目实践环节,提供 A100 算力支持,鼓励学员动手开发。第 2 期实战营共收到 500 多个项目申报,我们在众多的项目中为大家精选了 23 个优秀项目,现在就让我们一起欣赏下学员们的成果吧,看看他们是怎么将奇思妙想带入现实~

优秀项目一览

项目名称 项目 Slogan
销冠 ------ 卖货主播大模型 销冠大模型,智能卖货新体验
BeautyMaster-美妆达人 美妆达人,美丽您的每一天
Healthcare-Agent 医疗 AI 智能体 GenAI-Powered Consultant for Healthcare人工智能医疗保健顾问
雅鸭 ------ 雅思作文小助手 从未有如此简单之作文
医学文献综述助手 (又名 不想看文献) 不想看文献
狐言乱语-EssayAssistant 论文小助手 不如问一问神奇大狐狸吧
煤矿安全大模型---------矿途智护者 矿途智护者,守护每一次地下的平安旅程
智能营销助手 智慧营销,触手可及。推荐试穿,尽在掌握
千面英雄 千面英雄,你的英雄与众不同
layout_magic_llava:基于类llava架构多模态大模型的法律证据材料智能处理 Gaining insight into the truth
业务流程生成助手 让业务流程构建从此变得简单
smartPlanter 智能花盆 不挖野菜
医疗助手 医疗助手在手,谈病不再恐惧
罪恶克星-法律大模型 其实,我还是一名律师
Personalized LLM 领域研究助理 让 LLM 学习细分领域专业知识, 成为你科研的良师益友
古文诗词助手------诗墨 诗墨带您遨游绮丽的古文诗词世界
阿法兔---【谁是卧底】AI 游戏 AI 陪你玩游戏,Let's Go
峡谷小狐仙-多模态角色扮演小助手 妲己陪你玩
小红书风格旅游助手 出门旅行,再也不用做攻略!
动物医生-畜禽疫病诊断助手 更强的智能诊疗,更好的健康守护
Nuclear blueprint Assistant - 核电工程图纸识别的视觉大语言模型 蓝图助手,更专业的工业图纸系统
医美行业营销大模型 更轻松时尚的医美营销
G-Torque 游戏 AI 助手 empower play, enhancing way

优秀项目介绍

销冠 ------ 卖货主播大模型

Streamer-Sales 销冠 ------ 卖货主播大模型 是一个能够根据给定的商品特点从激发用户购买意愿角度出发进行商品解说的卖货主播大模型。项目功能点如下:

  • 📜 精心设计的数据集生成流程
  • 🧰 使用 XTuner 在 InternLM2 上指令微调模型
  • 🚀 LMDeploy 加速推理
  • 🎙️ ASR 语音输入
  • 🔊 TTS 文字转语音输出
  • 📚 RAG 检索增强生成
  • 🌐 Agent 网络查询实时快递等信息
  • 🦸 主播数字人视频生成

项目地址: github.com/PeterH0323/...

视频地址: www.bilibili.com/video/BV1ZJ...

应用地址: openxlab.org.cn/apps/detail...

美妆达人

"美妆达人"项目采用 InternLM2 大模型、XTuner 微调工具、LMDeploy 部署工具,为用户提供个性化时尚搭配建议。通过上传全身照和衣柜服装,结合季节、温度、天气、出行目的和个性需求,定制最完美的穿搭方案。

项目的亮点如下:

  • 大模型微调🔧:通过借助 XTuner 微调 InternLM2 模型,提高个性化推荐准确度;
  • 支持个性化穿搭👗:根据用户的个性需求和场合,定制个性化的时尚搭配方案;
  • 智能推荐🌦️📅:结合季节、温度、天气等因素,为用户提供实用的穿衣建议;
  • 简单易用📸:上传照片和服装,轻松获取时尚搭配方案,告别选择困难症;
  • 专业指导💡🔍:借助大数据分析和人工智能技术,为用户打造最佳时尚造型;
  • 良好扩展性✨:后期可扩展到面部妆容、发型、包包手饰;
  • 沉浸式体验🎨🌟:后期将搭配穿搭到用户身上,提供3D的视觉效果。

项目地址: github.com/RayTang88/B...

视频地址: www.bilibili.com/video/BV1Vz...

应用地址: openxlab.org.cn/apps/detail...

Healthcare-Agent 医疗 AI 智能体

GenAI 赋能,解读您的健康密码,个性化数据, 易懂化解读,它将成为您一生的健康伴侣,随时随地守护您的健康。

基于上海人工智能实验室的书生·浦语大模型,并通过专业医疗保健数据调优训练并系统开发的医疗保健智能体,为医疗保健工作者赋能提效,为家庭健康决策人提供全生命周期的健康管理。

项目地址: github.com/CDL0726/Hea...

视频地址: www.bilibili.com/video/BV1yM...

应用地址: openxlab.org.cn/apps/detail...

雅鸭 ------ 雅思作文小助手

雅鸭 IELTSDuck 是一款基于 InternLM2 进行 QLoRA 微调,专为雅思考生(主要针对初级与中级水平学习者)开发的创新 LLMs 辅导工具,旨在提升学生的雅思写作能力。

雅鸭 IELTSDuck 整合了作文结构引导、语法检查与改进、内容与逻辑评估以及智能评分等多功能,致力于帮助学生提升雅思写作水平。主要功能有根据雅思作文批改标准进行评估打分,并会指明失误点纠正语法、词汇问题,也会对文章内容逻辑进行分析。

主要功能:

  • 固定模板输出模块:利用 LLMs 技术,提供针对雅思写作评分的专业、有逻辑、分点清晰的模板,帮助学生构建作文结构。
  • 语法检查与改进模块:通过 Langchain RAG 技术和 InternLM 大型语言模型的整合,实时识别并纠正作文中的语法错误,并给出具体的修改建议。
  • 内容与逻辑评估模块:对学生的作文进行全面分析,给出针对性的优化建议,确保作文内容、结构和逻辑满足雅思官方评分标准。
  • 智能评分模块:通过微调 InternLM,自动评估学生作文的综合质量,提供接近官方评分标准的分数,并给出改善作文的具体指导。

项目地址: github.com/neverbiasu/...

视频地址: www.bilibili.com/video/BV1Xf...

应用地址: openxlab.org.cn/apps/detail...

医学文献综述助手 (又名 不想看文献)

这是一款基于 RAG 的医学文献综述小工具。用户可配置本地或远程大语言模型,通过关键词或 PMID 搜索 PubMed,上传 PDF 文件,并创建和管理文献数据库。通过聚类算法对文本分块进行聚类,用更少的算力生成对数据库内容的整体认识。最后工具可以基于用户提问生成带有参考文献的综述文本。旨在帮助科研人员高效检索、管理、阅读和总结文献。

项目地址: github.com/jabberwocky...

视频地址: www.bilibili.com/video/BV1df... 应用地址: huggingface.co/spaces/Yiju...

狐言乱语-EssayAssistant 论文小助手

狐言乱语论文小助手旨在解决论文的找、读、用等难题,项目分为狐聊、狐说、狐找、狐写四个模块,结合大模型帮助用户快速掌握论文概况,并可结合单页论文细读、精读相关内容。用户也可以通过关键词搜索遍览大量论文生成本地知识库,交由大模型推荐相关论文。亦可以上传本地论文组成知识库,由大模型生成论文综述。

项目地址: github.com//BigWhiteFo...

视频地址: www.bilibili.com/video/BV1NR...

煤矿安全大模型---------矿途智护者

本项目利用包括煤矿历史事故案例、事故处理报告、安全操作规程、规章制度、技术文档以及煤矿从业人员入职考试题库等在内的丰富数据资源,通过微调 InternLM2 模型,构建出一个专门针对煤矿事故和煤矿安全知识智能问答的煤矿安全大模型。为煤矿企业负责人、安全管理人员、矿工提供一个精确、迅速的信息查询、学习与决策支持平台。

  • 支持煤矿安全领域常规题型解答,如:单选题、多选题、判断题、填空题等 (针对煤矿主要负责人,安管人员、及煤矿各种作业人员)。
  • 支持针对安全规程规章制度、技术等文档内容回答(如《中华人民共和国矿山安全法》、《煤矿建设安全规程》)。
  • 支持煤矿历史事故案例,事故处理报告查询,提供事故原因详细分析、事故预防措施以及应急响应知识。

项目地址: github.com/yaosenJ/Coa...

视频地址: www.bilibili.com/video/BV1k7...

应用地址: openxlab.org.cn/apps/detail...

智能营销助手

获客、活客、留客是电商行业的三大难题,谁拥有跟客户最佳的沟通方式,谁就拥有客户。

随着用户消费转移移至线上,电商行业面临一些问题:

  • 用户交流体验差
  • 商品推荐不精准
  • 客户转化率低
  • 退换货频率高
  • 物流成本高

在这样的背景下,未来销售的引擎------大模型加持的智能营销助手就诞生了。

智能营销助手的模型由 InternLM2-chat-7B 指令微调而来,它能够与用户的对话,了解用户的需求,基于多模态的 AIGC 生成能力,应用层整合了 RAG、Agent、数字人、虚拟试穿、智能推荐等功能,能够持续输出更符合用户消费习惯的文本、图片、语音和视频等营销内容,推荐符合用户的商品,将营销与经营结合。

项目地址: github.com/wux-labs/Op...

视频地址: www.bilibili.com/video/BV1W1...

应用地址: openxlab.org.cn/apps/detail...

千面英雄

偶像、榜样的力量是无穷的,让人敢想敢干,克服困难,不放弃。千面英雄,利用时代最新的大模型技术,基于书生浦语大模型生态(基于 InternLM-7B 模型,利用 XTuner 微调,LMDeploy 部署),提供对话的形式,基于用户的价值观、兴趣、想要的成就、成长经历,个性化地推荐最契合用户的英雄偶像。让活生生的人和经历激励你,让你不怕摔倒,敢想,敢干的同时也能深刻意识到世界的复杂和交换成功所要付出的代价。

项目地址: github.com/Dimen61/fac...

视频地址: www.bilibili.com/video/BV127...

layout_magic_llava:基于类 llava 架构多模态大模型的法律证据材料智能处理

本项目主要基于以聊天截图证据为核心的法律诉讼及非诉讼案件的自动化处理场景,核心技术在于使用 XTuner训练 llava 架构模型,其中 llm 为垂直领域适配的 InternLM2 系列模型,该场景下 internvl 表现优秀,技术方案中亦有采用 internvl 预训练权重及数据集的考量。

具体地,基于垂直领域的多模态大模型技术,根据实际工作流程,提出以证据为主线的证据自动化处理 SOP,通过总结海量多模态信息汇总为具有法律意义的结构化信息等方式对繁杂且细节的证据整理工作的流程自动化处理,节省法律工作者的时间,使其能够将精力放在更重要的法律分析、法律研究以及争议解决上,提升司法行政效率和法律服务质量,提升人民的幸福感满足感获得感。

由于该项目高质量数据为执业律师及实习律师人工标注,某些专业场景需要等待数据提供,模型会持续迭代(架构图为 v0.5 版本)。

项目地址: github.com/ValeriaWong...

视频地址: www.bilibili.com/video/BV12e...

应用地址:openxlab.org.cn/apps/detail...

业务流程生成助手

业务流程(Business Process,BP)是为实现目标而使用的可重复的一组步骤。本项目以生成 BPMN 格式的业务流程为目标,以对地观测卫星的业务流程为背景,构建了相应的BP数据集,利用 InternLM2-chat-7B 作为基座模型,XTuner库进行 lora 微调,获得微调后的模型。最后生成的 BPMN 文件基本可以满足用户的需求,使得普通用户可以通过自然语言描述模型。

项目地址: gitee.com/zhou-muyan/...

视频地址: www.bilibili.com/video/BV1oF...

smartPlanter 智能花盆

一个集智能养护与互动娱乐于一体的智能花盆。

  • 硬件提供多角色互动聊天,赋予种植知识个性化的表达。
  • 不定时掉落来自植物反馈彩蛋。
  • 专属小程序,提供远程控制,用户可以随时随地掌握植物状态。同时配备农事专家。
  • 可开启全自动养护功能(补光、浇水),友好易用。
  • 自带液晶屏展示各类丰富内容。
  • 另有种植柜系列产品,实现蔬菜水果自由。

项目地址: github.com/Luchen-0420...

视频地址: www.bilibili.com/video/BV1M4...

应用地址: openxlab.org.cn/apps/detail...

医疗助手

本项目旨在开发一个基于茴香豆 RAG 框架和 InternLM2-7B 大模型的医疗助手,帮助患者和医生了解疾病信息和诊断流程。目标是使患者能够提前了解疾病信息,减少恐惧,并提高医生的诊断效率。

首先,收集和处理医学文献、疾病百科和诊断指南等数据,确保数据准确性和规范性。然后,使用这些数据对 InternLM2-7B 模型进行初步训练和微调,确保模型能够生成高质量的医疗回答。同时使用收集的治疗指南构建向量知识库,使用多路召回机制+重排机制来提高向量知识库的检索的命中率。项目实施过程中,将重视数据隐私保护和伦理审查,确保用户数据安全,系统回答准确可靠。

项目地址: github.com/aizhweiwei/...

视频地址: www.bilibili.com/video/BV1EA...

罪恶克星-法律大模型

罪恶克星是一个融合法律问答与审计助手功能的创新项目。通过推动法律技术的进步,罪恶克星希望在助力依法治国的道路上迈出坚实一步,为建设法治社会贡献力量。

依托先进的大模型技术,罪恶克星致力于提升法律咨询服务的效率和质量,为用户提供全面、精准的法律解答。

同时,它能智能化处理卷宗和材料,帮助律师摆脱繁琐的程式化工作,提高工作效率。

项目地址: github.com/yuetan1988/...

视频地址: www.bilibili.com/video/BV1zN...

Personalized LLM 领域研究助理

在大语言模型(LLMs)蓬勃发展的当下,个性化大语言模型(Personalized LLM)被视为下一个重要里程碑。我们正在尝试开发一款专注于该细分领域的研究助手。

与传统工具不同,我们期待这款助手更像是一位良师益友, 协助您探索个性化大语言模型的前沿秘境。它用通俗易懂的语言,阐释晦涩难懂的概念;用智能算法,发掘隐藏在海量文献中的关键信息;用友好互动,点燃您的创新灵感。

个性化大语言模型的实现仍面临诸多挑战。我们的项目只是一次有益的尝试,希望能为该细分领域的发展贡献绵薄之力。在这个过程中,我们也期待与业界同仁交流探讨,共同推进个性化大语言模型的研究与应用。

项目地址: github.com/1587causala...

视频地址: www.bilibili.com/video/BV1JW...

古文诗词专家助手------诗墨

古文诗词助手"诗墨",基于书生浦语大模型与工具链开发,旨在带领用户探索领略古文诗词的意境与风光,体会中华文化的博大精深。诗墨基于海量高质量古文诗词数据(覆盖唐宋两朝诗人以及两宋时期词人海量诗词数据以及论语等经典古文有关内容)以及复杂多样自我认知数据集,通过 XTuner 分步迭代微调 InternLM2 模型,并具备在线与诗墨对战功能页面,增加互动乐趣,其功能亮点如下:

  • 支持古文诗词创作,问答,古文诗词赏析,典故理解,诗人背景介绍,诗词意境阐释,文言文解析等诸多古文诗词领域任务。
  • 支持自我认知测试以及开发团队问答测试,包括对其英文名称 PoeticCalligraphy 的认知。
  • 挑战诗墨大模型,看看谁更懂古文诗词,用户可在经典古文诗词问题上与诗墨一决高下。
  • 以茴香豆为核心的多种格式古文诗词领域经典典籍问答 RAG 页面,支持用户针对相关经典典籍复杂问题对诗墨进行提问。
  • 以 Agentlego 为核心的古文诗词生图页面,带领用户体验古文诗词在视觉上的绮丽之美。

项目地址:

github.com/Micro647/Po...

视频地址:

www.bilibili.com/video/BV14n...

阿法兔---【谁是卧底】AI 游戏

InternLM2 为内核,结合达摩院 Agentscope 框架,搭建 AI 小游戏-谁是卧底,1 个真人用户和一群 AI 玩游戏,看谁笑到最后。

AI 的智能目前到了什么程度,如果人和 AI 一起玩游戏,到底谁会赢了?

本项目致力于探究大语言模型在 AI 游戏中的智力表现,并寻求新的价值点。

人工智能技术的进步和创新,促进了 AI 游戏的开发。在游戏中,AI 可以用于角色扮演、决策制定、路径规划、实时响应等多个方面,这些技术的突破和应用可以反过来推动其他领域的发展。例如,自动驾驶、智能助手、医疗诊断等领域都可以借鉴游戏中的 AI 技术。

本项目的特色:

  • InternLM2 为底座大模型,采用 LMDeploy 部署,API 对接。
  • Agentscope 框架,Multi agent 共同执行任务。
  • AI 游戏框架,灵活配置,自动分发节点信号,思考和执行当前的任务。
  • 人机结合,人类参与到游戏环节,与多个AI共同完成游戏。

项目地址: github.com/BarryYin/Al...

视频地址: www.bilibili.com/video/BV1Hf...

应用地址: github.com/BarryYin/Al...

峡谷小狐仙 ------ 多模态角色扮演小助手

本项目通过构造生成训练数据,采用 XTuner 微调书生浦语 InternLM2 模型的方式,打造了一个王者荣耀领域的角色扮演聊天机器人--峡谷小狐仙,同时结合 ASR技术实现语音输入、RAG 检索增强生成技术,生成王者英雄有关信息, TTS 技术实现声音克隆和语音输出、数字人技术实现了视频输出功能。

峡谷小狐仙将王者荣耀手游中特定游戏角色妲己的形象带入书生浦语语言大模型,在实现知识输出的同时,也达到角色扮演的效果。功能亮点如下:

  • ASR 语音识别技术🎤:支持用户的语音输入
  • RAG 检索增强生成📚:用户进行王者荣耀领域相关的提问,模型根据知识储备做出回答
  • SFT 大模型微调🧠:以峡谷小狐仙的语气口吻回答问题
  • TTS 文字转语音+语音克隆📢:模型模拟妲己的声音,并将LLM的回答以音频形式输出
  • 数字人👁:虚拟小狐仙在线陪伴

项目地址: github.com/chg0901/Hon...

视频地址: www.bilibili.com/video/BV1Ju...

应用地址: openxlab.org.cn/apps/detail...

小红书风格旅游助手

本项目主要致力于帮助人们更快获取旅游信息,并以轻松活泼的方式与用户互动🌟。当前收集旅游攻略,主要通过小红书、美团、抖音等 app 搜索,步骤繁琐、信息冗余,需要耗费游客大量精力去收集。因此创造一个可以直接获取旅行信息,并且能以活泼幽默的风格与游客互动的大模型app,就显得非常有必要。

在技术路线上,主要分为三步走,收集数据、微调模型以及网页应用部署。

  • 首先利用爬虫爬取小红书上关于旅游的相关信息,通过豆包api得到这些信息可能的问题,组成 question- answer 对📚。
  • 然后选择 InternLM2-chat-7B 🧠作为基座模型,利用 XTuner 库进行 lora 微调,获得微调后的模型。
  • 通过streamlit网页部署🚀。

问答功能包括:

  • 景点查询
  • 交通方式查询
  • 住宿查询
  • 当地美食及其店铺查询
  • 注意事项(防晒、防雨、高反等)
  • ···

项目地址: github.com/chengzidl/T...

视频地址: www.bilibili.com/video/BV1Yi...

动物医生-畜禽疫病诊断助手

本项目旨在搭建一个畜禽疫病诊断大模型,以提高畜禽养殖过程中疾病的早期预警和诊断能力。通过整合多模态数据,包括环境监测数据(如温湿度、CO2、NH3 浓度等)、动物行为数据(如声音、运动轨迹)以及生理数据(如体重变化、体温),构建一个智能化的疾病诊断系统。该系统能够在疾病早期阶段准确识别潜在的健康风险,从而及时采取干预措施,减少疾病传播和经济损失。

项目地址: github.com/Xpg74138/An...

视频地址: www.bilibili.com/video/BV1jZ...

应用地址: openxlab.org.cn/apps/detail...

Nuclear blueprint Assistant - 核电工程图纸识别的视觉大语言模型

专注于核工业 VLM 大模型提升对于行业图纸识别和逻辑推理。

爬虫获取相似图片,整理工业图纸、行业图像、纸质材料,结合工程专家(涉密)标注与 gpt4o prompt 标注(非涉密)。

利用 InternLM-20B 进行 prompt 语义、形式扩展,提升数据多样性、泛化效果。

对比 xcomposer2-4khd/internVL1.5/llava-llama3-8b 不同参数量训练模型,结合 LORA/QLORA/FULL 多种训练手段,综合提升模型对于 few shot、封闭行业的图纸识别。

项目地址: github.com/ztfmars/xen...

视频地址: www.bilibili.com/video/BV1f1...

医美行业营销大模型

医美行业营销大模型 是一个能够根据用户提问或需求描述输出医美相关咨询、整形初步方案、术后跟踪、营销方案及营销相关多媒介内容的大模型,有着专业独特的价值魅力,给用户带来更轻松更美的体验🧚。

  • 该模型使用 XTuner 在 InternLM2 的基础上微调,部署集成 LMDeploy 加速推理🚀。
  • 支持 RAG 检索增强生成📚,可随时更新产品信息、业务信息、企业信息以更好为用户提供服务💁♀️。
  • 结合 AIGC 技术输出多模态的文字、音频、图片、视频等营销相关内容,高效而精准的为营销人员提供辅助。
  • 支持 TTS 文字转语音🔊声音互动,支持营销人员数字分身👩⚕️宣传引导互动,让医美的营销获客、活客、留客变得更轻松又不乏时尚和科技感🌈。
  • 支持微信 AI 客服功能,为用户提供 24H 的咨询答疑、医美方案建议和术后跟踪。

项目地址: github.com/JerryXieHua...

视频地址: www.bilibili.com/video/BV1Qv...

G-Torque 游戏 AI 助手

3A 游戏逐渐在国内兴起,但这类游戏的通关率不高。其核心原因在于:

  • 日益碎片化的游玩时间导致游戏过程难以接续。
  • 预制的难度配置及难度曲线无法覆盖所有玩家。
  • 3A 游戏天然的低粘性,难以持续激励玩家。

G-扭矩,一个有用、有趣、有深度的 AI 助手。现阶段 G-扭矩 试图通过整合互联网上零散的游戏知识,以社区机器人的方式,为游戏玩家提供有价值的信息服务。但,G-扭矩 不止是个问答机器人,我们正在努力通过三个里程碑实现不中断游戏进程的、更智能的游戏助手,通过如下三项:

  • 基于 RAG 技术 的游戏攻略助手。(已完成 MVP 验证,正在扩大规模......)
  • 基于 Agent 技术的游戏社区管家。
  • 基于 强化学习、多模态技术 的桌面级 co-pilot 应用。

项目地址: github.com/eavae/gtorq...

视频地址: www.bilibili.com/video/BV1PV...

ps:第 3 期项目申请通道已经开放,欢迎感兴趣的小伙伴提交申请。 申请链接: aicarrier.feishu.cn/wiki/DjY6wh...

相关推荐
x-cmd2 分钟前
[240704] 苹果获得 OpenAI 董事会观察员席位 | mySCADA myPRO 发现可在设备上远程执行代码漏洞
人工智能·安全·chatgpt·微软·openai·cve·苹果
庞德公9 分钟前
解锁Diffusion Model: 初识Stable Diffusion、DALL-E、Imagen
人工智能·stable diffusion·imagen·dall-e
AI大模型-王哥13 分钟前
神经网络入门:从零到训练
人工智能·深度学习·神经网络·大模型·ai大模型
点云侠32 分钟前
matlab 干涉图仿真
开发语言·人工智能·算法·计算机视觉·matlab
逼子格33 分钟前
66、基于长短期记忆 (LSTM) 网络对序列数据进行分类
人工智能·rnn·深度学习·lstm·长短期记忆网络·序列数据分类
KompasAI34 分钟前
客户服务的智能升级:Kompas.ai如何改善客户体验
大数据·人工智能·aigc·语音识别·ai写作
2401_8576380342 分钟前
【深度解析】滑动窗口:目标检测算法的基石
人工智能·算法·目标检测
乐财业-财税赋能平台1 小时前
从手工到智能:乐财业鹦鹉系统引领财税管理新纪元
大数据·人工智能
还下着雨ZG1 小时前
【计算机视觉系列实战教程 (实战01)】:图像锐化操作(并手写锐化操作)
人工智能·opencv·计算机视觉
弈秋0011 小时前
llama-factory训练RLHF-PPO模型
人工智能·深度学习·语言模型·自然语言处理·chatgpt·transformer·llama