文心X1.1深度思考模型上线多个基准测试达到SOTA

前沿技术瞭望官2025-09-09 16:14

9月9日，WAVE SUMMIT深度学习开发者大会2025在京举行。会上，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布了文心大模型X1.1深度思考模型，该模型在事实性、指令遵循、智能体等能力上均有显著提升。目前，用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台，对企业客户及开发者全面开放使用。

据王海峰现场介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架，一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自蒸馏数据的迭代式生产及训练，不断提升模型整体效果。相比文心X1，X1.1的事实性提升34.8%，指令遵循提升12.5%，智能体提升9.6%。

在多个权威基准评测中，文心X1.1整体表现超越DeepSeek R1-0528，在部分任务上展现出领先优势。同时，在与国际顶尖模型GPT-5和Gemini 2.5 Pro相比，效果持平。

文心大模型的能力拓展和效率提升，得益于飞桨文心的联合优化。大会现场，百度还发布了飞桨核心框架3.2版本，在大模型训练、硬件适配和生态支持上全面升级，并同步升级大模型开发套件ERNIEKit和高效部署套件FastDeploy。

据最新数据披露，飞桨文心生态开发者达到2333万，服务企业达到76万家。

文心X1.1深度思考模型上线 多个基准测试达到SOTA

文心X1.1深度思考模型上线多个基准测试达到SOTA