在这些回答背后共同折射出的一个现实是------大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。
作者| 皮爷
出品|产业家
过去的5个月,李亮很忙。
"从今年3月份文心一言发布之后,很多工业侧的企业,甚至是国央企,都主动来和我们探讨大模型的落地。"他表示,"也包括很多行业伙伴都找过来,说看如何一起打造具备服务共性的平台。"
作为百度智能云的一位工程师,过去的近半年时间里,他真切感受到了企业对AI大模型的热切程度。这种热切是企业对具备落地能力的新技术的期待,也更是担心落后的焦虑。
这不是个例。
伴随着OpenAI和国内一众大模型企业的频频发声,越来越多的"产业+AI大模型"框架正在清晰地呈现在企业面前,相较于之前的元宇宙、区块链等技术,AI大模型应用距离企业的真实场景更近,应用路径也更短,效果更"立竿见影"。
但在热火朝天的AI实践里,越来越多企业开始逐渐发现一个更为现实的问题:最佳的大模型切入点在哪?或者说,企业应该如何高效地构建适配自身的大模型?
问题背后,对应着一众企业在大模型转型路上的"挫折"。"现在很多企业的问题是有意愿,但没渠道;或者是尝试后,整体进度很慢。"一位投资人告诉我们,"中间包括数据清洗、标注,以及prompt的生成、模型微调、训练这些,市面上都没有特别易用的方式。"
实际上,这些现象也构成了尽管企业对大模型热情依旧高涨,但越来越多开始在迈出第一步同时保持"谨慎"态度,这种观望在清晰与否的转型路径,也更在参与其中的成本性价比。
不过,AI加速的好消息依旧在传来。在刚刚过去的8月31日,百度文心一言、商汤商量SenseChat等大模型首批通过了《生成式人工智能服务管理暂行办法》备案,正式面向全社会开放服务。此外,据悉,针对企业用户,百度智能云还将在9月5日举行的2023百度云智大会上宣布四大配套举措,旨在助力企业以更低成本更快捷方式使用上大模型。
在滚滚而来的AI洪流中,企业应该如何选择适合自己的大模型?或者说,在如今大模型开放的AI时代,怎样的AI大模型才能成为企业在AI数智化时代的最佳航船?
在8家大模型获批上线的当下,这个问题正在被加速推到台前。
一、AI需求,和背后的新产业命题
在得出答案之前,不妨先来看天平的另一侧:即客户AI落地的难点到底在哪?
"现在大家对于大模型在行业会怎么落地,有哪些完全颠覆性的应用,或者说这种能带来很大风潮的应用,会出现在哪儿,也都不是很确定。其实我们客户也很清楚的认识到这一点。"百度智能云一位解决方案工程师表示。
这是如今国内很多企业面临AI大模型的共性。即尽管企业对自身的业务场景有充分的认知,但大模型能做到哪一步,以及如何使用大模型进行原有业务的降本增效,这都是未知命题。
而对部分已经尝试的企业,问题则是更为尖锐。
"我们最开始使用的是国外开源模型,但最近也在考虑尝试重新接入国内的大模型,因为国外开源的中文语义理解太差了,基本的交互都出现问题。"一位低代码企业创始人这样告诉我们。
有同样感受的是另外一家农业方向的企业,在和其创始人的交流过程中,他直言,"从最开始做prompt,到后面一轮一轮的训练,包括数据清洗、高质量标注等等,整个过程的开销非常大的,训练效果还不是特别好,甚至不如原有界面。"截止到目前,这家企业的大模型产品仍然处在内测阶段,尚未对外使用。
在这些之外,更多的企业则是停滞在大模型的"第一步"------选型。
不过,在选型阶段,企业的顾虑有所不同。对目前大部分中小企业而言,其选型难的原因在于不清楚哪家底层大模型企业的产业能力强,这些能力包括产品能力,也更有对模型微调、知识增强等服务落地的要求。
而对大型企业而言,除了数据安全之外,产业理解和复用性是企业的最核心考量。"大企业更看重的是,你不仅要在我看重的这一点的业务上能做出效果,还有就是要在整个集团的复用性上,能和既有业务结合的效率要更高。"上述工程师表示。
在他的感知里,以央国企为代表的大型企业更多地希望大模型服务商是一个教练的角色,不仅要给到好的工具,还要教会企业怎么用,从长期提升价值。
从更大的视角来看,当下大模型落地的难点大概分为三个层面,一是企业不知道选择怎样的大模型,或者说企业不知道自身的需求怎样的大模型可以满足,视野范围内的大模型选项太少;二是对部分选择自建大模型的企业而言,其在prompt提示词和数据清洗、标注以及中文增强等工具链层面屡屡碰壁,投入太大或者经验不足;三是企业自身的数据安全和合规性较高,同时需要较深的产业know-how,对大模型服务商的功能能力要求较高。
不难感知到的是,如果从原子化服务的角度拆解来看,当下国内企业对大模型的需求已然不仅在产品层面,如参数、逻辑推理等硬核指标,更大的需求点涌现在服务侧,即对不同企业需求的一站式满足,这些满足或是在prompt层面、或在中文增强、数据标注、训练层面,再或是在产业场景适配乃至数据安全,以及最核心的成本层面。
大模型,已然从一道单纯的技术命题,悄然进化为一道糅合技术、产品、服务等全部环节的产业综合命题。
二、千帆背后,看见大模型的"真实表达"
在忙碌的几个月里,李亮对一家企业印象很深刻。
"有一个矿山行业的合作伙伴,在大模型的领域非常期望跟我们合作,想要通过大模型去进行整个的矿山的智慧化服务,包括安全生产的管理,安全生产的预警等等。"他说道,"我们现在在跟他进行多轮测试,有很多也有非常不错的测试效果。"
**他的意外之处在于,像矿山这样的偏传统的企业,也开始主动找到百度寻求大模型方面的进展和落地。**据了解,如今双方经过多轮共创,一个基于矿山场景的大模型已经接近成型。
实际上,这不是第一个主动找到百度智能云的企业。而百度智能云对这些产业伙伴的一个统一服务界面,正是在今年3月份正式推出的一站式企业级大模型平台"百度智能云千帆"。
作为唯一TO B大模型界面,百度智能云千帆也恰构成着百度大模型在如能源、金融、政务、交通等不同产业场景的真实表达,以及包括数据管理、模型训练、评估&优化、预测服务和Prompt工程和插件服务等全部大模型开发周期的能力展示。
而在刚刚过去的8月,它更是交出了一张亮眼的成绩单。
一个亮眼之处是,在本次对外公布的模型种类中,百度智能云千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个开源大模型,成为国内拥有大模型最多的平台。
换言之,基于百度智能云千帆的"模型仓库",除了文心大模型之外,企业可以自行适合自身的其它基础大模型产品。
此外,和其它模型仓库不同的是,百度智能云千帆对"模型仓库"内的模型进行了"二次加工"。
比如,在安全性层面,千帆对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出;再比如在成本层面,对每一个接入的大模型,千帆都做了二次性能增强。
根据测算,在性能调优后,第三方模型体积可压缩至25%-50%,推理成本可降低50%。这意味着,相较于直接调用,企业在千帆平台上使用这些模型可极大地节约成本,提升效果。
与此同时,千帆对接入的大模型做了深度适配,其为企业提供模型再训练的全套工具链以及多种形式模型调优,其中包括SFT(全量参数微调、Prompt Tuning、Lora)及强化学习(奖励模型学习、强化学习训练)等等。
换言之,基于百度智能云千帆,不论是选择文心大模型,还是平台上的第三方开源大模型,企业都可以端到端地搭建自身的专属模型。
不仅于此,在对外的服务能力上,百度智能云千帆可以为企业提供公有云和私有部署两种方式,包括上文所说的大模型落地难的推理、微调、托管,企业都可以基于公有云模式接入使用。而在本地部署方面,百度智能云千帆也更是可以纯软件和软硬一体的交付方式,充分满足企业本地部署的要求。
实际上,这些能力在也构成了百度智能云千帆在一众产业侧的真实落地。根据不完全统计,在过去的5个月时间里,千帆大模型平台在超过400个真实产业场景中实现了落地。截止目前,百度文心大模型已拥有中国最大的产业落地规模。
**这些落地构成了中国大模型赛道的一个个特殊节点。**比如在能源层面,百度智能云和国家电网联合打造的"设备运检知识助手"入选北京市首批十大行业大模型应用案例。与深圳燃气联合发布的"深燃-百度·文心大模型",基于大模型能力,只需要进行微调,就可以形成针对性的行业模型能力,完成多个应用场景的任务。
再比如在金融层面,百度智能云与中信金控联合打造了基于大模型的数字人,让每一位银行客户都有自己专属的理财顾问,可以承担包括投研助手、投顾助手、营销助手、合规助手等在内的多个角色。
这些真实的产业落地侧写也更在一众中小企业侧。根据不完全统计,已经有超过10万家企业申请测试,这个数目伴随着如今面向全社会层面的开放动作,也更在加速倍增。据了解,在在开放的24小时内,文心一言共计回复网友问题数超过3342万个。
可以说,不论是在产品层面,还是服务层面,千帆大模型为企业提供的是一个开放兼容的大模型选择界面,在这里,企业既可以实现从0到1的端到端大模型搭建,也更可以寻求到包括数据标注、prompt在内的一众工具链能力,以最低的成本和门槛,构建出自身的专属大模型。
三、AI时代,我们需要怎样的大模型?
如今,越来越多人开始讨论的一个命题是:在如今的产业数字化时代,我们需要怎样的大模型?有的人的回答是产品,有的人的回答是服务,也更有人的回答是数据安全。
在这些回答背后共同折射出的一个现实是------大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。
不过,这些问题也正在被作答。
以百度智能云为例,除了在产业领域侧联合企业进行落地之外,其也更是和生态伙伴联合打造了更多基于特定场景的产品。比如和软通动力打造的大模型基础设施软通天璇2.0,与微盟联合构建的AI应用型产品WAI,以及和金蝶、金山办公一起研发的专属领域大模型产品。
在这个新的团战背后,大模型正在以更加真实的姿态出现在各个产业场景和各个企业应用中,不仅是金融、能源,也不仅是大型的央国企,在如今百度智能云千帆的底座之上,越来越多的产业场景和越来越多体量的企业都正在齐力迈出AI大模型时代的第一步。
此外,从更大的视角也同样能清晰看到的是,这些产业的真实表达也恰在构成着大模型企业的产品和营收新增长飞轮。
根据不完全统计,截至目前,**百度智能云千帆平台上有103款Prompt模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。**其中既有基于百度智能云在产业实践中积累的Prompt模板,也有来源于文心一言高频用户的Prompt模板。可以预见的是,作为大模型训练中最核心的环节之一,这些Prompt模板将使得千帆更容易被企业和市场欢迎。
而在财报层面,根据百度发布的2023年Q2财报显示,第二季度百度营收341亿元实现加速增长,净利润高速增长44%。此外,由《IDC中国AI公有云服务市场份额,2022》报告数据显示,2022年中国AI公有云服务总体市场79.7亿元,其中百度智能云占28.9%排名第一。
或者可以说,在AI大模型在成为各个产业基建企业验金石的同时,它也更在成为一个新的发动机。
进度仍在持续推进。在接下来的9月5日,百度智能云还将在2023百度云智大会上宣布四大配套举措。
据内部人士透露,在此次大会上,百度智能云将全面升级"千帆大模型平台",升级将覆盖算力基础设施、大模型工具链、高质量数据集等等。此外,其将推出基于文心大模型重构的行业解决方案,同时还将发布覆盖服务营销、办公提效、生产优化三大领域的10款企业级的AI原生应用产品。大模型相关的生态政策也将在大会上同步披露。
或许再来回答前面那个问题,即"我们需要怎样的一个大模型?"------这不仅是一个对企业而言,寻找最佳选项的命题,也更是对大模型企业而言,锚定未来和自证的长期思考。
恰如百度相关负责人在采访中所说,"未来肯定还会有更多AI产品,或许这些产品不是百度开发出来,但企业都可以基于百度智能云千帆开发出来,这是我们想要的,也是会一直持续去做的。"
答案,已经在成形的路上。
*文中李亮为化名