百度沈抖:智能,生成无限可能

4月16日,Create 2024百度AI开发者大会在深圳举行。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布新一代智能计算操作系统------百度智能云万源。它能管理万卡规模的集群,极致地发挥GPU、CPU的性能;它有强大的大模型作为核心引擎,构建起全面的大模型服务能力。它让应用开发像搭积木一样简单,提升AI原生应用的开发效率与体验,加速AI原生应用的爆发。

沈抖表示,传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统,对新的计算平台,也就是智能计算做好抽象和封装,重新定义人机交互,为开发者提供更简单、更流畅的开发体验。百度智能云万源,就是这样的新一代智能计算操作系统。

百度集团执行副总裁、百度智能云事业群总裁 沈抖

以下为演讲实录:

大家上午好!今天,我想用一句我非常喜欢的话来开场:"简单是终极的复杂"。

这句话来自苹果公司的第一本宣传册,也有人说它来自达芬奇。不论来自哪里,它代表着我们对极简之美的共同追求。

在百度,我们的使命就是"用科技让复杂的世界更简单"。回到今天的主题"人人都是开发者",那我们追求的一种简单,就是让每个人都可以用极简的方式开发出极强的软件。

80年前,第一代"程序员"手动插拔电缆、转动旋钮,用布线板来操作计算机,难度大、效率低还容易出错。

后来,汇编语言和汇编器出现了。我们可以用一种相对自然的方式告诉机器如何工作,大大提高了开发效率。这种让程序代替人工、让软件管理硬件的方式,就是操作系统的雏形。

但这还远远不够。

再后来,高级编程语言和编译器诞生了,计算平台进一步进化,开发者可以用更接近人类的方式表达需求,无需关心底层软硬件的复杂性。大多数的应用可以在不修改任何代码的情况下,都可以迁移到其它硬件上去运行。

9,000+行代码的UNIX6

4,300,000+行代码的WinNT

45,000,000+行代码的WinXP

软件越来越复杂,硬件越来越先进。随之升级的是快速迭代的操作系统。

本质上,操作系统就是管理硬件和软件,往下一层层屏蔽底层的复杂性、往上抽象成简单的交互界面。对开发者来说,只需要关注业务本身的逻辑,使用简单的编程工具和语言,开发相应的软件功能。

随着软件规模和复杂度的提高,单台机器已经不能满足需求,集群出现了。

集群出现以后,操作系统管理的对象,不再是单台机器和运行在上面的"进程",而是整个集群和上面运行的各种"微服务",管理的对象和复杂性有了质的变化。

云计算应运而生,集群管理的复杂性从此被隐去,开发者可以按需扩缩容,灵活响应市场的变化。

到了今天又不一样了,大模型出现了。机器和系统第一次不再是人类的提线木偶,而是具备了"理解、生成、逻辑和记忆"的能力。这将彻底改变人和机器的关系,这其中最重要的一点就是软件开发的范式。编程不再是少数经过专业训练的程序员的特权。相反,人人都是开发者。编程不再需要从C/C++学起,而是从自然语言开始;编程不再是面向过程、面向对象,而是面向需求,以后编程的过程,就是一个人表达愿望的过程。

这是革命性的变化。它会彻底颠覆原有的操作系统。

在操作系统的内核中,底层的硬件从以CPU算力为主变成以GPU算力为主,而且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。操作系统管理的对象,从管理进程到管理微服务,进而进化到了管理智能。

传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统,对新的计算平台,也就是智能计算做好抽象和封装,重新定义人机交互,为开发者提供更简单、更流畅的开发体验。那这种操作系统到底应该长什么样子呢?

它需要能管理万卡规模的集群,需要极致发挥GPU、CPU的性能,需要高速互联。

它需要有强大的大模型作为核心引擎,不仅是语言大模型,还有视觉大模型。

而这些就构成了操作系统的内核。

在内核层之上,还需要构建起强大的大模型服务能力,我们刚才提到内核层的各种模型,它们的精调、评估、部署、调用等工具链,我们都要建立起来。

而在这之上,我们还有好的应用开发工具去做工作流编排、插件管理,让应用开发像搭积木一样简单!

当然了,一个操作系统,作为企业服务,安全和运维也必不可少。

此外,它还要隐藏掉上一代云原生系统的复杂性。

而且最后,它要能够推动加速AI原生应用的爆发。

这就是新一代智能计算操作系统......万源!

鼓个掌!这个鼓掌很值得,为什么呢?

有一种说法叫软件定义世界,而今天我们呈现的万源就是用来帮助人类去定义软件。

接下来,我们打开万源,看看里面的每一个部分。

首先是内核层。大模型不是免费的午餐,强大的模型能力需要巨大的算力、甚至电力,算力的有效管理至关重要。实际上现在因为不合理的算力管理和使用方法,当下社会上很多算力被浪费掉了。我们需要一个强大的操作系统将现有的算力资源发挥到极致,支撑大模型和应用创新的迭代。

我们知道,要训练一个好的大模型,需要上万张卡的集群。但是,如果要让上万张卡像一张卡一样工作、实现性能的线性扩展、保障任务不间断,这对集群的设计、调度、容错都是巨大的挑战。

目前,在百舸,我们的万卡集群上的有效训练时长占比达到了98.8%;线性加速比和带宽有效性都超过了95%。这绝对是业界最高级别的算力效能。

在算力方面,国内还有一个特殊情况,就是芯片供应的不确定性,这必然会导致将来多款芯片并存的格局。短期看,这是大家被动接受的局面;但是长期看,这一定是大家主动选择的结果。因为只有这样,才能摆脱对单一芯片的依赖,实现更优的成本,保证更有弹性的供应链。

但是,不同厂商的芯片差异很大;即使同一厂商,不同代际的芯片差距也很大。用来推理还可以,但如果想训练大模型、尤其是在单一训练任务上,把不同芯片用好非常难。

今天,我很高兴地告诉大家,百舸平台上已经实现了百卡规模、单一训练任务下,不同厂商芯片的混合训练,而且把训练的性能损失控制在3%,即使在千卡规模下,性能损失也不超过5%。可见百舸已经给大家屏蔽掉了芯片之间的差异,给了大家选择不同芯片组合的权利!

这里真的应该有掌声,我们苦芯片久矣。芯片会变得越来越多元,我们需要这样的能力去帮助我们管理不同的芯片,把它们绑在一起像一款芯片一样工作。

当然了,内核中的另一个重要组成部分是大模型。它压缩了庞大的世界知识,将理解、生成、逻辑、记忆能力封装起来、向上提供简单的接口,让AI原生应用可以高效运行。

万源的内核,既包含了业界领先的ERNIE 4.0、3.5这些海峰刚刚讲过的模型、也包括ERNIE Speed/Lite/Tiny系列轻量模型,此外还包括文心视觉大模型和一些各有特色的第三方大模型,充分满足用户在不同业务场景下的多样化需求。

内核之上是千帆ModelBuilder。内核中的这些模型的管理、调度、二次开发,都可以通过ModelBuilder解决。很多场景化的需求,不需要从头去训练大模型,只要在合适的基础大模型上,做些模型精调、甚至就是改一下提示词,就可以很好地解决问题。

ModelBuilder的目的就是要把这些工具产品化,屏蔽掉模型开发的复杂性,让更多人只需要投入少量的数据、资源和精力,就能快速精调出适合自己业务的模型。

在实际应用中,就像Robin刚才提到的,我们需要合理地组合不同的模型。ModelBuilder提供的模型路由服务,会自动给不同难度的任务选择最合适的模型,实现效果和成本的最优组合,在效果基本持平的情况下,它可以使得推理成本降低30%以上。

再往上看,是工具层。千帆AppBuilder和AgentBuilder是强大的应用开发平台,正如Robin刚才已经演示了好几个这样的案例,它们可以支持各种agent和应用的快速开发和发布。通过AppBuilder开发的应用,可以一键发布到百度搜索、微信公众号等平台,也可以通过API或SDK的方式直接集成到您自己的系统中。真正做到极速开发,轻松上市。

当然了,现阶段,大模型还不够完美,有些场景下,人的经验可以帮agent做更好的任务规划,因此AppBuilder发布了工作流编排功能。基于AppBuilder的工作流编排,开发者可以使用预置的模板和组件,轻松定制自己的业务流程,还可以在上面集成、扩建自己特色的组件,在不同节点上选用不同的模型。如果您在ModelBuilder上精调了模型,那现在在AppBuilder上也可以很方便地直接调用,整个过程非常便捷。

所以现在大家可以看到,万源从内核到Shell、再到应用开发工具,已经实现了层与层的有机结合、端到端的效能优化。过去一年多,在内外部客户的各种实际应用中,不断打磨、持续完善,万源,已经成为AI原生时代的智能计算操作系统,为用户提供极简的开发体验、智能的系统内核,和高效的异构算力。

今天的发布是一个起点。未来,我们会进一步开放操作系统各个层面的生态合作。

向上,我们要开放更多的能力和接口,开发者可以非常简单地开发应用。

向左,我们可以用万源作为基础、帮助大家打造出适合自己垂直行业的操作系统。

向右,我们可以把万源直接部署在智算中心,享受稳定、安全、高效的智能计算平台。

向下,我们会适配更多的芯片,为开发者进一步隐去异构集群的复杂性,让不同的芯片都能发挥最大的效能。

除了底层硬件,我们也欢迎更多的合作伙伴一起,在模型、工具、应用等各个层面上持续丰富万源的生态。

这就是我今天要给大家分享的,全新一代智能计算操作系统------万源,强大、敏捷、开放,为在座诸位和每一个有想法的人提供极致简单的开发体验,让您的每一个创意都能在分钟之间上线、应用!

今天,人人都是开发者,人人都是创造者。

无需等待,即刻启程。

让智能,生成无限可能!谢谢大家!

------------------END------------------

推荐阅读

基于afx透明视频的视觉增强前端方案

百度一站式数据自助分析平台(TDA)建设

浅析如何加速商业业务实时化

登录系统演进、便捷登录设计与实现

一文带你完整了解Go语言IO基础库

相关推荐
小样vvv18 小时前
【面试篇】Dubbo
面试·职场和发展·dubbo
程序员的世界你不懂2 天前
从定义、原理、环境搭建、安装问题排查等深入了解Appium
经验分享·百度·appium
扣脚大汉在网络2 天前
云原生安全渗透篇
安全·云原生·dubbo
mghio2 天前
Dubbo 中的集群容错
java·微服务·dubbo
深眸财经4 天前
从商汤科技年报,看一家AI企业的确定性叙事
人工智能·科技·百度
蜂耘4 天前
百度萝卜快跑能成为全球无人驾驶出行市场主导者吗?
百度·汽车
itwangyang5204 天前
人工智能在生物医药领域的应用地图:AIBC2025将于6月在上海召开!
人工智能·百度
飞桨PaddlePaddle5 天前
飞桨PP系列新成员PP-DocLayout开源,版面检测加速大模型数据构建,超百页文档图像一秒搞定
人工智能·百度·paddlepaddle·飞桨·deepseek
北屿升:5 天前
Scala:大数据时代的多面手
百度·微信·微信公众平台·facebook·新浪微博