名列前茅!百度文心大模型4.5及X1在中国信通院“方升”大模型基准测试中表现优异

中国人工智能产业发展联盟(以下简称"AIIA")紧密跟踪大模型和智能体的技术发展与行业应用动态,构建并发布了"方升"(FactTesting)大模型基准测试体系,自2024年以来已对国内外开源与闭源大模型开展了6轮能力监测,累计测试了200余个大模型,持续跟踪其技术演进与表现,为行业技术选型与能力评估提供了重要依据。2025年,评测范围进一步扩展至多模态理解、文生图、文生视频等领域,并率先开展智能体测试的研究与实践,初步构建了智能体测试验证平台,为产业界提供全面的技术评估参考。

2025年4月9日,在南京召开的中国人工智能产业发展联盟第十四次全体会议上,中国人工智能产业发展联盟正式发布"方升"大模型基准测试结果(2025年1季度)。

"方升"大模型基准测试结果发布现场

在权威发布环节,AIIA 总体组组长、中国信通院人工智能研究所所长魏凯发布了"方升"人工智能基准测试结果及测试观察。在大语言模型测试结果中,文心大模型4.5在基础能力结果、文心大模型X1在推理能力结果中均名列前茅。

大语言模型-基础能力测试结果

大语言模型-推理能力测试结果

3月16日,百度正式发布文心大模型4.5和文心大模型X1。

文心大模型4.5 是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。

文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,**是首个自主运用工具的深度思考模型。**作为能力更全面的深度思考模型,文心大模型X1兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

文心一言官网

目前,两款模型已在文心一言官网上线,免费向用户开放。(yiyan.baidu.com

2025是大模型技术全面迭代的一年,百度将在人工智能、数据中心、云基础设施上更大胆地投入,打造更好、更智能的下一代模型。

----------END----------

推荐阅读

飞桨新一代框架3.0正式发布:加速大模型时代的技术创新与产业应用

即刻体验!文心大模型X1现面向企业用户全面开放!

一篇论文,看见百度广告推荐系统在大模型时代的革新

前沿多模态模型开发与应用实战3:DeepSeek-VL2多模态理解大模型算法解析与功能抢先体验

秒哒首发即爆发!上线首日吸引2万用户,打造3万应用!

相关推荐
2601_961194022 天前
27考研资料|免费全套|电子版
考研·百度·微信·pdf·微信公众平台·facebook·新浪微博
数据皮皮侠2 天前
全国消协智慧 315 平台投诉信息数据库
大数据·人工智能·算法·百度·制造
KaMeidebaby3 天前
卡梅德生物技术快报|抗原如何自己检测?FAdV-4 重组抗原制备与 ELISA 体系技术调试指南
前端·人工智能·物联网·算法·百度
qq7422349844 天前
从“感知”到“决断”:测评百度伐谋产业决策智能体的端到端推理与行动机制
人工智能·算法·百度·大模型·运筹优化
2601_961194024 天前
初中英语教资笔试资源|科三教案模板和知识点资料
百度·微信·微信公众平台·facebook·twitter·新浪微博
RD_daoyi7 天前
Google SEO第三周:网站站内基础优化——决定排名快慢的核心基建
大数据·人工智能·学习·搜索引擎·百度·googlecloud
KaMeidebaby8 天前
卡梅德生物技术快报|蛋白翻译后修饰:YAP/TAZ 分子调控机制与靶向干预技术
前端·人工智能·物联网·百度·新浪微博
罗光记8 天前
Solon Server 启动模式深度解析:从 0.3MB 内核到 10+ Server 插件
其他·百度·微信·微信公众平台·新浪微博
子非鱼@Itfuture8 天前
国内可直接用、免费额度/永久免费的大模型API清单(含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等)
百度·ai·aigc·个人开发
道可云9 天前
减少60%重复实验分析,道可云智能体赋能生物医药企业
百度