AI时代,百度的三大主义

现实主义、长期主义、理想主义


定焦One(dingjiaoone)原创

作者 | 苏琦 郑浩钧

编辑 | 魏佳

"人工智能很像是一次新的工业革命,这意味着它不会三五年就结束,也不会一两年就出现'超级应用',它更像是三五十年对于整个社会一次彻底的重构。"

11月12日下午,李彦宏与硅星人创始人骆轶航,以及甲子光年创始人张一甲进行了一场"AI圆桌对谈",再一次表达了他对AI的信仰,同时阐释了百度在AI上的战略和思考。

这场对谈也是对当天"百度2024世界大会"的延续。世界大会上,李彦宏发布了文心iRAG、无代码工具"秒哒"、自由画布等核心技术和产品,宣告"AI应用的群星闪耀时刻已然到来"。

李彦宏在对谈中表示,将此次百度世界大会的主题定为"应用来了",是出于"有用"这一价值观。他表示,模型本身不产生直接价值,只有在模型之上开发各种应用,在各种场景找到所谓的PMF(产品市场契合),才能真正产生价值。"如果说2023年大家还在卷模型,让模型能力逐步地达到可用地步的话,那未来所谓的'可用',就是真的有东西用,应用的'用'。"

自百度成立以来,李彦宏一直在AI领域进行前瞻研究和清醒布局。这样的坚守需要定力,也有厚积薄发的力量,不仅能带着百度朝前走,也能给行业带来理性的声音。

李彦宏的布道之路还在继续,他在圆桌访谈中表露心声:"在这条路上,需要长期主义、理想主义和现实主义的结合。"

这三大主义,也在李彦宏多年的AI探索中得到体现。

现实主义:

解决幻觉难题,降低使用门槛

一年前,李彦宏曾呼吁,"大模型本身不仅不产生任何价值,还造成了对公司资源、社会资源的巨大浪费。"

如果不做通用大模型,创业者应该做什么?当时李彦宏给出的答案是:AI原生应用,"我们需要的不是100个所谓的大模型,而是100万量级的AI原生应用。"

时间过去快两年,超级应用却迟迟没来,原因一方面是部分应用的技术有硬伤,例如文生图幻觉严重,中看不中用;另一方面是应用开发门槛太高,不够智能。在2024百度世界大会上,李彦宏带来两个杀手锏:iRAG(检索增强的文生图技术)和秒哒,解决了上述两大现实存在的技术难题,宣告"AI应用的群星闪耀时刻已然到来"。

**百度之所以选择做iRAG,是从现实的用户需求出发进行的倒推。**李彦宏在访谈中提到,应用需要大模型能力,而大模型想要具备实用价值就需要有效控制幻觉生成,所以团队开始研究iRAG技术,并开发在ToB场景的应用。

同时,多模态要想进入真正实用阶段,也得有准确性和可控性,应用空间才能打开,这同样离不开iRAG。

iRAG技术作为大模型的一项基础技术,在影视作品、漫画作品、海报制作等几乎所有的创作场景,都能有广泛的应用空间,且可以大幅降低创作成本、提高创作效率。

李彦宏在对谈中举例,比如以前汽车的实拍宣传海报动辄需要十几万元,如果运用iRAG,不仅创作的成本接近于0,还能在保持车该有的形态的前提下,放飞人们的想象,创作出真正有创造力的故事情节,宣传也会更吸引人。

无代码工具"秒哒"的发布也让人兴奋。现在硅谷很重视辅助代码生成,美国很缺工程师,所以现在很多技术和工具都是用来提升这些工程师的效率。

但是百度的思路是,除了能让金字塔塔尖的人更加有效率优势,还想做出一款工具让金字塔中间层和底层的人,都拥有金字塔塔尖这些人的能力。

随着基础模型和智能体的能力逐步提升,百度把这些能力综合在一起,发布"秒哒",让一行代码都看不懂的人具备程序员的能力。**"当几亿、十几亿人都具备这种能力的时候,它对于创造力的爆发,是辅助代码生成工具无法比拟的。"**李彦宏表示。

上述两大技术是李彦宏AI现实主义的体现,但这条"实用之路"也是一个逐步发展的过程,不会一蹴而就。"但它是非常有希望的赛道,一个人今天能够写两百行代码,一年以后可能能写两千行代码,再过三年可以写两万行代码,这个能力会逐步发展出来,激发更多人的创造性。"李彦宏在对谈中称。

长期主义:

10年投千亿,应用终爆发

很多人提到巨头做AI和创新,最大的负担是legacy(遗产),但是李彦宏在访谈中直言,百度真正的legacy就是"相信AI","一旦你把这个东西当成legacy,很多东西就都很好解释,我就是在做我多年前一直想做的事。无论是深度学习、机器学习还是产品积累,一切都源自百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。"

在大学时期就学习AI相关课程的他,很早就意识到AI是解决搜索引擎问题的核心技术,所以过去10年间百度投入1700亿研发和布局AI。他不仅自己信仰AI,还鼓励公司和社会关注AI,2012年,距离OpenAI成立还有3年,他就发布全员信鼓励全百度产品经理了解AI技术。2013年,他在百度年会上宣布成立深度学习研究院并担任院长。

李彦宏曾在2021年的《致股东信》中写道,"过去10年,我们打基础、建生态,在人工智能大潮奔涌而来的今天,百度成为了领先的AI生态型公司。"

正因为搭好了基础,如今才有了数以千万计的智能体和数十万的产业应用在百度的AI生态中涌现。

百度是少见的将智能体作为最重要战略方向的公司。根据用户的不同需求,李彦宏将智能体分为四类,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。

百度之所以将智能体看得如此重要,不仅因为其开发门槛低、天花板足够高,还看到了智能体与搜索结合,能拓展搜索的边界。

换句话说,百度不仅提供基础大模型和应用开发工具,还提供分发渠道,在百度里搜相应的词,搜出来的结果有可能就是一个智能体。目前,百度新搜索已经成为了智能体分发最大入口,日均分发已超1000万。

李彦宏在访谈中解释,当百度的AI生态里拥有大量智能体的时候,能够将人的需求和智能体进行高效匹配和连接的渠道,还是搜索。同时,人与智能体需要多轮交互,甚至需要调用工具解决问题,这两者的结合拓展了搜索的边界,能打开更多新的可能性。

随着应用开发门槛的降低、智能体的增加,百度文心大模型的调用量也在迅速增长。据百度官方透露,目前文心大模型的日均调用量已超过15亿,较一年前首次披露的5000万次,增长近30倍。

李彦宏在访谈中分享了自己的观察,文心大模型最近两个月调用量的陡升背后是开发者群体的觉醒,他们逐步意识到可以用模型做出应用,这样的需求足够旺盛。

除了智能体,一些像百胜中国、智能招聘这样的公司,也因为和百度的合作,在它们具体的业务场景里,能够更加高效、更加低成本、更加快速的获得实实在在的收益。

百度构建智能产业生态的主要依托是百度智能云。目前在百度智能云的千帆大模型平台上,已经累计精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,60%的央国企以及大量的民营企业,都在联合百度智能云进行AI创新。

目前,百度已经发布基于大模型的100大产业应用,涵盖制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。

理想主义:

从AI拓荒者成为领跑者

虽然此次百度世界大会发布的更多是人人可用的产品,李彦宏的演讲也没有谈很大的命题,但是他身上仍表现出了"理想主义者"的影子。

一方面,百度把很多研发资源投在了"理想主义者"看重的东西上面,李彦宏在访谈中提到,"我们不断地在这方面加大投入、付出努力,没说并不代表没有做"。另一方面,李彦宏过去24年的AI信仰和沉淀,本身就是一种"清醒的理想主义"。

这个清醒体现在面对困境不迷茫,在2020年上海世界人工智能大会上,面对行业的低迷,李彦宏表示当下人工智能所处的阶段,是一个容易产生迷茫甚至悲观的阶段,这是大多数颠覆性技术在加速普及之前的必经阶段。"百度也曾从这样的低谷期爬出来过,所以我相信熬过寒冬就能成为新的英雄。"

这个清醒还体现在,市场冷清时率先布局、耐心坚守;市场热闹时消除噪音,看到潮水真正的流向。

相比于很多其他公司,在2022年11月OpenAI发布ChatGPT后才匆忙进入大模型领域,百度的文心大模型1.0版本早在2019年3月就发布。而当国内生成式大模型的浪潮来袭,李彦宏又呼吁不要卷大模型,应该专注实际场景,重视应用。这样的表态,在当时的环境下需要极大的勇气,事后证明,这其实就是全球主流的AI方向。

2022年底创立的Perplexity.ai,创建了一种高效直接的搜索体验,百度也在去年3月发布文心一言App。到今年,各类以大模型为基础的国产智能助手遍地开花,再一次验证了李彦宏的猜想。

最前沿的技术浪潮是等不来的,浪潮到来前的每一步也都不会白走。这种对AI始终如一的信仰和清醒,给了百度更大的信心和回报。李彦宏带领的百度已经成为一个拥有广泛用户基础的AI生态型公司:在深度学习、对话式人工智能操作系统、自动驾驶等前沿领域均已深度布局。

过去三十年,中国的电脑行业和手机行业飞速发展,但遗憾的是,在这两个行业中,还没有出现中国操作系统巨头,李彦宏更大的理想,或许是让百度成为AI时代"操作系统"的最后胜利者。"我们的主要精力放在做工具、做基础平台,让大家更容易的在这上面开发应用。"

对于百度来说,搭建基础设施,在把自身优势放到最大的同时带动更多人一同开发创造,这是比取得某个单项赛道的胜利更有想象力、更有价值的事情。

2021年李彦宏在《致股东信》中曾写道,"每当百度徘徊在十字路口,我都会问自己,什么才能够让人真正制胜未来?"他给自己的答案是两方面:一是你信仰什么,二是你有多大的决心。

过去24年,李彦宏和百度对AI的信仰没有一丝改变,唯一改变的是,他们正在离自己的信仰越来越近。

相关推荐
yuanbenshidiaos1 小时前
【大数据】机器学习----------强化学习机器学习阶段尾声
人工智能·机器学习
Ase5gqe6 小时前
大数据-259 离线数仓 - Griffin架构 修改配置 pom.xml sparkProperties 编译启动
xml·大数据·架构
好评笔记6 小时前
AIGC视频生成模型:Stability AI的SVD(Stable Video Diffusion)模型
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc
史嘉庆6 小时前
Pandas 数据分析(二)【股票数据】
大数据·数据分析·pandas
算家云6 小时前
TangoFlux 本地部署实用教程:开启无限音频创意脑洞
人工智能·aigc·模型搭建·算家云、·应用社区·tangoflux
唯余木叶下弦声7 小时前
PySpark之金融数据分析(Spark RDD、SQL练习题)
大数据·python·sql·数据分析·spark·pyspark
叫我:松哥8 小时前
基于Python django的音乐用户偏好分析及可视化系统设计与实现
人工智能·后端·python·mysql·数据分析·django
重生之Java再爱我一次8 小时前
Hadoop集群搭建
大数据·hadoop·分布式
熊文豪8 小时前
深入解析人工智能中的协同过滤算法及其在推荐系统中的应用与优化
人工智能·算法
Vol火山9 小时前
AI引领工业制造智能化革命:机器视觉与时序数据预测的双重驱动
人工智能·制造