"只有最好的大模型,才能长出最好的人工智能原生应用"。
随着 8 月底第一批大模型应用通过备案上线,中国人工智能大模型市场进入全新阶段,通过备案的科技公司和机构研发的大模型产品,可以向所有用户提供服务,而之前只能开展人数受限的测试。
许多大模型从业者认为,中国将会出现大量的大模型应用。但怎样用大模型的能力解决大量用户的共同需求做出爆款应用,仍然存在许多未知数。在过去大半年的探索中,一些行动较快的大模型公司和创业者正试着给出参考。
AI 原生应用是大模型存在的意义
9 月 5 日,历时 3 个多月的百度 "文心杯" 创业大赛结束,15 个团队被选为优胜者,他们除了得到百度的数千万元投资,还会在技术、产品、发展战略、资本合作等方面获得百度的长期支持。
百度 CEO 李彦宏在颁奖致辞时说,一个好的人工智能原生应用至少具备三个条件:支持自然语言交互,支持理解、生成、推理、记忆信息等,且交互不应超过两级菜单,人工智能原生应用要能解决过去解决不了或解决不好的问题,而不是对移动互联网应用或者电脑软件的的简单重复。
"模型本身不直接产生价值,基于基础大模型开发出来的应用才是模型存在的意义。" 李彦宏说移动互联网时代操作系统只有 Android 和 iOS,特别成功的应用却很多,大模型时代也会出现类似的情况------基础大模型是操作系统,基于大模型实现的新功能,是人工智能时代的 "原生应用"。
在人工智能的新格局中,大模型能力是基础,它直接决定了大模型应用的上限,但只靠大模型无法构成繁荣的生态,建立在大模型上的应用也是其中关键。
此前中国的大模型都以模型开发为主,应用层往往被忽视。但如果所有人都只关注模型开发,而没有人去开发应用,就会像没有轮子的车。在海外,大模型应用层早已开始发展。在国内,百度算是开了个头。
"我们希望创业者在文心大模型之上,可以做出 AI 时代的爆款应用。" 李彦宏说。百度起于大模型测试阶段的创业大赛现在告一段落,但没有迹象表明百度培育大模型创业生态的动作会停下来。
15 个胜选应用覆盖多个细分方向
基于文档的问答助手、设计创意辅助、医学内容生成、新材料发现、二次元内容创作、销售人员培训......百度大模型创业大赛优胜团队的项目,覆盖多个细分方向。它们共同展示了大模型应用创业的诸多特征。
首先,致力于大模型应用的创业者通常对他们所要改变的场景有深入的理解。正是由于对特定应用场景的深度理解,创业者才更能洞察这些场景中已有方案所面临的问题,从而更可能利用大模型开发出更优的解决方案。
本次大赛中获得一等奖的 ChatDOC 公司庖丁科技创办于 2017 年,成立至今的六年间,一直在做处理金融文档相关的产品,比如根据客户提供的大量的资料写出招股书。同样获得优胜奖的 ChatPPT 项目,负责人周泽安在 PPT 引擎和功能开发方面有 10 年经验,此前的创业项目口袋动画曾被 WPS 收购。
海外持续获得客户和投资的大模型创业公司类似。比如估值达到 15 亿的大模型应用公司 Jasper AI,主要用大模型的能力为客户提供营销方面的支持,其创始团队有深厚的营销背景。去年 11 月拿到 OpenAI 领投 2700 万美元的语言学习应用 Speak,创始人在高中就做出了辅助学习记忆的应用并卖了出去。
其次,创业者的策略不是在大模型的基础上构建全新的解决方案,而是使用大模型去优化原有解决方案的某个特定环节。在这个优化过程中,他们尽可能地发挥出大模型的独特优势,同时规避其仍然存在的弱点。
"我们核心不在于大语言模型,而是如何让一个人工智能胜任人类导购的一个角色。" Buysmart.AI 创始人陈历飞说,根本在于怎样让它正确地理解用户的问题,然后推荐出争取的商品。Buysmart.AI 是另一个获得百度大模型创业大赛一等奖的项目。他们采取的做法是将大模型与推荐算法结合起来,发挥其理解和处理大量信息的能力。
ChatDOC 的 CEO 林得苗说,市场上同类的智能文档产品,经常出现答非所问、自己生成答案的现象。因此他们在 ChatDOC 中会限制大模型的生成能力,要求它给出的每一个回答,都要引用原文,如果找不到合适的原文,就反馈 "没有找到",而不是胡乱回答。
在使用大模型辅助发现新材料的幻量科技,大模型现在发挥的最大价值,是辅助构建不需要掌握代码,就可以去调用先进算法和实验的计算实验平台。"大语言模型一定程度上降低了使用软件或操作每一台仪器的成本,可以直接通过语音,去实现特定的操作。" 幻量科技创始人兼 CEO 刘雨阳说。
第三,对于大模型应用而言,虽然切换底层的大模型并不困难,但若长期使用同一大模型,可能会产生依赖性。这次参加百度大模型创业大赛的团队,不少早期都基于 ChatGPT 开发应用在海外发展,而在国内的业务,现在切换到了文心一言。
"把一个海外的模型换成一个国内模型,这个难度没有预想的那么大。我们换了之后,就改动不需要特别多,整个流程就能够跑起来。"Buysmart.AI 创始人陈历飞说。
利用大模型辅助创作二次元内容的 Genie AI 的 CEO 彭康伟也有类似的感受,从 ChatGPT 切换到文心一言上,"模型的微调和一些关键词的表述,相差并不算多,从安全和兼容中文方面来看,文心一言会更好一些"。
不过在她看来,如果长期使用一个大模型,比如 ChatGPT,想要彻底发挥它的能力,就要围绕它设定产品架构,构建代码,"时间长了切换模型是有成本的"。
这是大模型竞争中常被忽视的一个层面。大模型应用的开发者可能会对某一特定的大模型产生依赖,这就意味着那些更早步入市场、更早吸引创业者的大模型供应商,会具有更大的优势。
大模型逐步进入 AI 原生应用时代
在大模型政策落地前,绝大多数公司在推广大模型应用方面表现得相当谨慎。他们面向个人用户的产品通常处于内部测试或邀请测试的阶段,普通用户无法直接注册或使用,且各公司并不会主动投放广告来推广大模型产品,这些因素都限制了产品的传播速度。
政策落地创造的新环境,使大模型竞争转变为一场全面能力的较量:成功的关键不再仅仅是一家公司训练大模型的技术实力,还包括它洞察市场需求、开发出匹配的应用以及优秀的运营能力。
这对每一家开发大模型应用的创业公司都是考验。对于开发基础大模型的公司来说,考验还直接关系到它们建立生态系统的能力。这可能才是它们竞争力的直接体现。
李彦宏认为,"只有最好的大模型,才能长出最好的人工智能原生应用"。他说百度不久后就会推出文心大模型 4.0 版本,目标是 "百度的目标是打造好大模型的基础能力,支持好人工智能原生应用开发"。
百度在大模型生态上的投入也在持续。据了解,除了 "文心杯" 创业大赛外,百度还面向开发者推出 AI Studio 星河大模型社区、插件机制以及文心大模型 "星河" 共创计划,吸引更多人加入百度的大模型生态。
根据百度披露的数据,目前百度智能云千帆大模型平台每月都活跃的企业近 10000 家,覆盖金融、制造、能源、政务、交通等行业的 400 多个业务场景。
8 月底,百度的文心一言通过相关部门的备案,正式向公众开放。百度称,文心一言开放第一天,就回答了网友 3342 万个问题,"大量真实人工反馈有助于百度快速、高效改进基础模型。"
"我相信文心大模型将成为 AI 创业者、开发者的首选,越来越多的应用会建立在模型之上,整个生态系统将充满活力。" 李彦宏说。