百度决定背叛闭源大模型,李彦宏重新拥抱开源

继昨天决定免费之后,百度刚刚又发布一则重磅消息------

下一代文心模型,决定开源

而且官宣内容只有一句话(字少事大的感觉):

我们将在未来几个月中陆续推出文心大模型 4.5 系列,并于 6 月 30 日起正式开源。

从收费到免费,从闭源到开源...... 嗯,DeepSeek 带来的冲击着实是有亿点点大。

从闭源到开源的文心一言

回顾文心一言的发展历程,2023 年 3 月 16 日,是一个重要的时间节点。

在这一天,百度的文心一言正式启动邀测。

而这也是上市公司里第一个推出类 ChatGPT 应用,所采取的 "路径" 也与 OpenAI 一致,闭源。

在同年的 8 月 31 日,文心一言率先向全社会全面开放。

当时有多受欢迎呢?开放首日,文心一言就共计回复网友超 3342 万个问题。

到了 2023 年 11 月 1 日,文心一言专业版正式上线,成为中国首个采用会员模式面向 C 端收费的大模型产品。

而在短短的 2 年时间里,文心一言版本也已经迭代到了 4.0,从日均调用量和各种榜单成绩来看,是推动中国大模型发展不可或缺的组成部分。

从技术角度来看,文心大模型的核心技术之一是知识增强

不同于仅靠大规模文本数据训练的 LLM(如 GPT 系列),文心一言结合了百度的知识图谱(涉及万亿级实体和关系),让模型在问答任务中更精准,减少幻觉问题。

除此之外,文心一言还通过持续学习(Continual Learning),让模型能够动态适应新知识,避免旧知识遗忘问题。

加之多任务学习(Multi-Task Learning),文心一言能在对话、翻译、阅读理解、代码生成等多种任务间共享知识,提高泛化能力。

文心一言还具备强大的多模态理解和生成能力,包括图像生成、视频生成和语音交互等等。

最重要的一点是,文心一言的背后还有百度强大的生态支撑,百度搜索、百度地图、百度智能云等,可以提供更完整的 AI 服务。

而从收费到免费,从闭源到开源,或许是大模型发展所使然;毕竟就在昨天,不仅是百度,就连 OpenAI 也官宣了 "免费" 的动作。

不过今天百度能够决定开源,一定程度上也展示了百度在 AI 领域的开放态度和技术自信。

据悉,百度计划在今年发布多款模型,并在下半年文心大模型 5.0 版本,多模态能力将会有显著提升。

李彦宏谈 DeepSeek

而就在刚刚过去的阿联酋迪拜 World Governments Summit 2025 峰会上,李彦宏也谈及了对 DeepSeek 的看法。

在被问到 DeepSeek 是否是意料之中时,李彦宏表示:

我认为,创新是不能被计划的。你不知道创新何时何地到来,你所能做的是,营造一个有利于创新的环境。

李彦宏指出大语言模型领域创新速度极快,如今大模型推理成本每年能降低 90% 以上,远超过去计算机革命的速度:

我们生活在一个非常激动人心的时代。

在过去,当我们谈论摩尔定律时说,每 18 个月性能会翻倍、成本会减半;但今天,当我们谈论大语言模型时,可以说每 12 个月,推理成本就可以降低 90% 以上。

这比我们过去几十年经历的计算机革命要快得多。

他认为创新的本质是成本下降与生产力提升,中国企业因成本压力在多领域积极创新,百度在推理和训练方面的创新也取得显著进步。

不过有意思的一点是,李彦宏在更早前对于 "开源和闭源之争" 的观点是------闭源模型比开源模型更强大......

但现在,DeepSeek 冲击波之下,百度比 OpenAI 更快改变,重新看待大模型开源。

今天,百度做了一个修正过去的决定。

参考链接:

1\][mp.weixin.qq.com/s/VEPMufLTl...](https://link.juejin.cn?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMjM5NzU2OTgyMg%3D%3D%26mid%3D2663207956%26idx%3D1%26sn%3D22ad573a688cb5562210d78f96c09e17%26scene%3D21%23wechat_redirect "https://mp.weixin.qq.com/s?__biz=MjM5NzU2OTgyMg==&mid=2663207956&idx=1&sn=22ad573a688cb5562210d78f96c09e17&scene=21#wechat_redirect") \[2\][mp.weixin.qq.com/s/pU0N5kjbc...](https://link.juejin.cn?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMjM5NzU2OTgyMg%3D%3D%26mid%3D2663207907%26idx%3D1%26sn%3Db1e37a645ff59e4184ac8a4ef235fa8b%26scene%3D21%23wechat_redirect "https://mp.weixin.qq.com/s?__biz=MjM5NzU2OTgyMg==&mid=2663207907&idx=1&sn=b1e37a645ff59e4184ac8a4ef235fa8b&scene=21#wechat_redirect") --- **完** ---

相关推荐
熙梦数字化13 小时前
2025汽车零部件行业数字化转型落地方案
大数据·人工智能·汽车
刘海东刘海东13 小时前
逻辑方程结构图语言的机器实现(草稿)
人工智能
亮剑201813 小时前
第2节:程序逻辑与控制流——让程序“思考”
开发语言·c++·人工智能
hixiong12313 小时前
C# OpenCVSharp使用 读光-票证检测矫正模型
人工智能·opencv·c#
大千AI助手13 小时前
HotpotQA:推动多跳推理问答发展的标杆数据集
人工智能·神经网络·llm·qa·大千ai助手·hotpotqa·多跳推理能力
红尘炼丹客13 小时前
《DeepSeek-OCR: Contexts Optical Compression》速览
人工智能·python·自然语言处理·ocr
TiAmo zhang13 小时前
现代C++的AI革命:C++20/C++23核心特性解析与实战应用
c++·人工智能·c++20
mwq3012314 小时前
从傅里叶变换到 RoPE:解构位置编码的数学灵魂
人工智能
升鲜宝供应链及收银系统源代码服务14 小时前
升鲜宝生鲜配送供应链管理系统---PMS--商品品牌多语言存储与 Redis 缓存同步实现
java·开发语言·数据库·redis·缓存·开源·供应链系统
LinXunFeng14 小时前
Flutter 拖拉对比组件,换装图片前后对比必备
前端·flutter·开源