文心X1.1深度思考模型上线 多个基准测试达到SOTA


9月9日,WAVE SUMMIT深度学习开发者大会2025在京举行。会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布了文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

据王海峰现场介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。

在多个权威基准评测中,文心X1.1整体表现超越DeepSeek R1-0528,在部分任务上展现出领先优势。同时,在与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。大会现场,百度还发布了飞桨核心框架3.2版本,在大模型训练、硬件适配和生态支持上全面升级,并同步升级大模型开发套件ERNIEKit和高效部署套件FastDeploy。

据最新数据披露,飞桨文心生态开发者达到2333万,服务企业达到76万家。

相关推荐
交通上的硅基思维2 小时前
人工智能安全:风险、机制与治理框架研究
人工智能·安全·百度
人工智能AI技术13 小时前
手搓一个AI搜索引擎:基于百度DeepSearch框架的实战开发笔记
人工智能·百度
陈思杰系统思考Jason1 天前
系统思考与敏捷的区别
百度·微信·微信公众平台·新浪微博·微信开放平台
zhangfeng11332 天前
千帆平台目前不支持用户自助上传自定义词表(vocabulary)进行训练 Post-pretrain 阶段 SFT都不支持
人工智能·百度
wei_shuo2 天前
「源力觉醒 创作者计划」_百度开源文心 4.5 系列开源大模型:ERNIE-4.5-VL-28B-A3B-Paddle vs DeepSeek-R1 多维度测评分析
百度·开源·文心大模型·gitcode
数据猿3 天前
我参与了百度文心App AI群聊内测,提前感受到了社交AI的革命
人工智能·百度
大力财经3 天前
性能超越DeepSeek-OCR2,百度发布并开源新一代SOTA OCR模型
百度
小朱笼包3 天前
小程序实现对接百度AI大模型,通过websocket连接进行百度实时语音识别,将返回的文字调用AI大模型API获得返回的消息内容进行文字转语音朗诵并操作
人工智能·websocket·百度·小程序·语音识别
陈思杰系统思考Jason3 天前
系统思考:以客户为中心
百度·微信·微信公众平台·新浪微博·微信开放平台
陈思杰系统思考Jason4 天前
系统思考:创造价值并非卖时间
百度·微信·微信公众平台·新浪微博·微信开放平台