文献分享 | 百度提出AI搜索新范式:以多智能体协作重构复杂信息检索流程

从信息检索到"类人搜索":我们为何需要AI搜索范式?

随着人类社会信息量的激增,人们面临的不再是"能否找到答案"的问题,而是"能否在复杂多源数据中快速获取可信、全面的答案"。传统搜索引擎起源于关键词匹配与文档排序,虽然随着技术发展引入了语义匹配、学习排序(Learning to Rank)等机器学习技术,但其核心模式始终是"文档检索+点击阅读",系统只提供"线索",真正的整合、判断与归纳依然依赖用户自身完成。

近年兴起的检索增强生成(Retrieval-Augmented Generation,RAG)技术------如ReAct与RQ-RAG------在将检索结果与生成能力结合方面取得了显著进展,但它们普遍仍采用静态逻辑,存在诸多局限。一方面,这类系统主要依赖"一次性"的文档检索与单智能体执行模式,缺乏对复杂、上下文依赖任务的灵活处理能力。尤其在面对诸如"汉武帝与凯撒大帝谁更年长"这样看似简单、实则涉及多步逻辑推理与多源信息整合的问题时,现有RAG系统常常输出片面甚至错误的结果。其根本原因在于系统普遍缺乏动态规划能力、执行反思机制与多阶段决策能力,难以应对信息缺失、推理失败或路径偏差等问题。这一挑战凸显出当前AI搜索系统在认知能力、推理能力与流程适应性方面的不足。

百度提出"AI搜索范式":以多智能体协作模拟人类信息处理

为解决上述痛点,百度搜索团队提出了一种新型搜索框架------AI Search Paradigm(AI搜索范式)。该系统并非单一模型驱动的流水线式架构,而是由多个协同工作的智能体组成的模块化系统。研究团队设计了四个核心角色:Master(总控)、Planner(任务规划者)、Executor(执行者)和Writer(答复生成者)。每个智能体都基于LLM驱动,并承担明确、专业化的任务,整个系统具备高度的灵活性、模块化和可扩展性。

在实际运行中,系统首先由Master对用户查询进行复杂度评估与意图分析,并据此动态配置智能体组合。对于简单查询,例如"汉武帝的名字",只需由Writer根据语言模型内部知识直接生成答案。而当遇到需要外部信息支撑或多步推理的问题时,系统会自动引入Executor甚至Planner参与任务处理。特别地是,Planner通过构建有向无环图(DAG)将复杂问题拆解为多个子任务,明确其逻辑依赖关系,并为每个子任务绑定合适的外部工具,例如Web搜索API、计算器、编程服务等。随后,Executor按图执行这些任务,处理失败重试,最终由Writer整合所有结果形成准确而有条理的回答。

DAG结构化任务规划与动态工具调度:从"执行"走向"理解"

AI搜索范式中最具创新性的环节是任务规划与执行的结构化建模。传统RAG往往依赖模型在上下文中隐式推理,而百度团队通过Planner智能体将用户查询转化为一张任务执行图(DAG),每个节点代表一个具体的操作步骤。例如在"汉武帝与凯撒大帝谁更年长"的问题中,系统将其分为三步:分别检索两位历史人物的出生年份,并计算年龄差。这种结构化的规划允许系统清晰地表达任务意图、任务间的依赖关系以及必要工具调用顺序。

工具调用由一个名为MCP(Model-Context Protocol)平台统一调度管理。系统不仅使用语义检索技术匹配相关工具,还通过引入COLT算法对工具间的协作关系建模,确保一次性检索出满足"组合性需求"的工具集合。例如在处理涉及货币换算与股票估值的任务时,系统不仅要找到股票工具,还需自动关联汇率查询工具,从而完成跨模态的数值推理。这种"以任务为中心"的工具检索方式,显著提升了执行完整性与系统鲁棒性。

可反思、可重试、可重构:Master驱动的反馈与修正机制

系统中另一个关键角色是Master,它不仅在任务初始阶段完成智能体配置,还全程监控子任务执行状态,实时判断输出结果是否满足预期。在检测到执行失败、信息缺失或答案不完整时,Master会调用Planner重新规划局部DAG,甚至替换无响应工具,体现出强大的自适应能力。这种机制使得AI搜索范式突破了传统流水线式搜索系统"错误即终止"的刚性逻辑,迈向类人搜索的反思性与动态性。

多智能体联合优化:用强化学习实现系统级协同进化

在系统优化层面,百度团队没有像传统方法一样仅对单个模型进行微调,而是将Planner作为优化核心,并引入多维度奖励机制与强化学习策略(GRPO)实现多智能体协同进化。优化目标涵盖最终答案准确性、用户反馈满意度、子任务执行成功率及结果格式规范性等多个方面,从系统级保障整体性能与用户体验。这种方法弥补了传统监督微调在多智能体环境下难以协同的问题,是推动AI系统工程化、可落地的重要探索。

案例实证:系统更懂你,答案更靠谱

通过与传统RAG系统的对比实验与案例分析,百度展示了AI搜索范式在用户复杂查询场景下的显著优势。例如在前文所述的历史人物年龄比较问题中,传统RAG无法从单一文档中找到完整答案,而AI搜索范式成功调用多个Web搜索与计算工具,准确输出:"汉武帝享年69岁,凯撒大帝享年56岁,相差13岁。" 这样的结果不仅信息完整,而且语言自然,展示了系统在多阶段推理、信息整合与语言生成三方面的协同能力。

AI搜索迈向认知智能时代

"AI搜索范式"的提出,不只是一次系统架构的优化,更是信息检索范式的转变。从静态、线性的检索生成流程,到动态、协作、可反思的智能体系统,百度的研究展示了一个面向认知智能的搜索未来。这一工作不仅对搜索引擎设计提供了新的理论与实践路径,也为Agent协作、多模态工具调度与大模型系统级工程优化提供了重要参考。

未来,随着大模型能力持续进化与Agent生态完善,类似AI搜索范式的系统将可能成为新一代知识服务平台的技术核心。搜索,不再只是寻找结果,更是理解问题、规划行动与给出判断的全过程智能服务。

参考链接

相关推荐
这儿有一堆花17 小时前
ImageMagick 高效图像处理与自动化指南
图像处理·人工智能·自动化
空山新雨后、17 小时前
深度学习VS强化学习:预测与决策的本质差异
人工智能·深度学习·强化学习
悦数图数据库17 小时前
BOSS 直聘基于悦数图数据库构建智能根因定位平台的实践
数据库·人工智能
好奇龙猫17 小时前
【人工智能学习-AI-MIT公开课第 17.-学习:boosting 算法】
人工智能·学习·boosting
BFT白芙堂17 小时前
基于 GPU 并行加速的 pRRTC 算法:赋能 Franka 机械臂的高效、稳定运动规划
人工智能·深度学习·算法·机器学习·gpu·具身智能·frankaresearch3
华如锦17 小时前
一.2部署——大模型服务快速部署vLLM GPU 安装教程 (Linux)
java·linux·运维·人工智能·后端·python·vllm
CServer_0117 小时前
汽车零部件生产:从“管理软件”到“数据驱动”的智能中枢
人工智能·汽车
MoonOutCloudBack17 小时前
Nash-MTL:在多任务梯度组合中引入纳什谈判解
论文阅读·人工智能·深度学习·机器学习·多任务·帕累托最优
说私域17 小时前
小程序电商运营中“开源AI智能名片链动2+1模式S2B2C商城小程序”对培养“老铁”用户的重要性研究
人工智能·小程序·开源