文心X1.1深度思考模型上线 多个基准测试达到SOTA


9月9日,WAVE SUMMIT深度学习开发者大会2025在京举行。会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布了文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

据王海峰现场介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。

在多个权威基准评测中,文心X1.1整体表现超越DeepSeek R1-0528,在部分任务上展现出领先优势。同时,在与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。大会现场,百度还发布了飞桨核心框架3.2版本,在大模型训练、硬件适配和生态支持上全面升级,并同步升级大模型开发套件ERNIEKit和高效部署套件FastDeploy。

据最新数据披露,飞桨文心生态开发者达到2333万,服务企业达到76万家。

相关推荐
KaMeidebaby1 天前
卡梅德生物技术快报|抗原如何自己检测?FAdV-4 重组抗原制备与 ELISA 体系技术调试指南
前端·人工智能·物联网·算法·百度
qq7422349842 天前
从“感知”到“决断”:测评百度伐谋产业决策智能体的端到端推理与行动机制
人工智能·算法·百度·大模型·运筹优化
2601_961194022 天前
初中英语教资笔试资源|科三教案模板和知识点资料
百度·微信·微信公众平台·facebook·twitter·新浪微博
RD_daoyi5 天前
Google SEO第三周:网站站内基础优化——决定排名快慢的核心基建
大数据·人工智能·学习·搜索引擎·百度·googlecloud
KaMeidebaby6 天前
卡梅德生物技术快报|蛋白翻译后修饰:YAP/TAZ 分子调控机制与靶向干预技术
前端·人工智能·物联网·百度·新浪微博
罗光记6 天前
Solon Server 启动模式深度解析:从 0.3MB 内核到 10+ Server 插件
其他·百度·微信·微信公众平台·新浪微博
子非鱼@Itfuture6 天前
国内可直接用、免费额度/永久免费的大模型API清单(含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等)
百度·ai·aigc·个人开发
道可云7 天前
减少60%重复实验分析,道可云智能体赋能生物医药企业
百度
KaMeidebaby7 天前
卡梅德生物技术快报|蛋白修饰调控 NETosis 分子机制及实验研究进展
前端·数据库·人工智能·算法·百度
腾视科技AI7 天前
部署“人工智能+” 推动一二三产业向智能化跃迁
人工智能·科技·百度·ai算力模组·ai模组·ai边缘算力模组