演讲主题:AI 搜索智能探索------基于AI搜索开放平台的Agentic Search算法技术揭秘
在全球AI技术快速迭代的背景下,信息检索与搜索技术正迎来革命性突破。
9月26日,云栖大会AI搜索与向量引擎分论坛上,阿里云智能集团高级技术专家------徐光伟 深度解析了基于AI搜索开放平台的Agentic Search算法技术体系,并结合技术架构演进与商业化实践,展示了阿里云在向量模型优化、多模态检索、DeepSearch/DeepResearch等领域的创新成果。
AI搜索趋势的演进:从静态检索到动态智能
徐光伟指出,AI搜索技术经历了三个关键阶段:传统智能搜索(全网/垂类/云端搜索)------RAG 增强搜索(结合大模型生成能力)------快速发展的 Agentic Search(代理式动态搜索)。
Agentic Search 通过大模型自主决策"何时、何地、如何"执行搜索任务,可完成复杂任务规划等操作。徐光伟强调,阿里云AI搜索开放平台实现了三阶段技术的融合,在保留传统搜索高效性的同时,通过大模型赋能动态任务执行,为客户提供全栈式解决方案。
技术亮点一:低维高效向量模型,平衡性能与成本
针对向量检索中高维度带来的存储与计算压力,阿里云实现套娃 Adaptor 技术,通过在 Embedding 模型后添加轻量级 MLP 映射层,在无监督场景下将向量维度压缩至 512 维的同时保持近似完整向量的精度。
实测数据显示,在存在有监督数据时该技术在客户场景中实现 Recall@1指标提升超 10 个百分点。目前,向量降维服务与定制化模型训练能力已集成至 OpenSearch 产品,支持企业按需调用。
技术亮点二:多模态检索能力升级,覆盖多样化场景
面对图片、视频等非结构化数据的快速增长,阿里云自研并开源 Ops-MM-embedding 模型,在 MMEB 榜单中达到开源模型领先水平。
该模型通过三阶段训练(跨模态对齐、难负样本挖掘、领域数据微调)及 Ensemble 优化,显著提升文本-图像/视频的跨模态检索精度。
例如:
- 电商图搜:支持多主体识别,可在一张图片中定位多个商品并精准匹配相似结果。
- 视频检索:支持长视频关键时刻的精准定位,实现秒级直达用户所需内容。
多模态检索技术已经在多个领域展现出巨大价值。在零售电商中,通过图像理解与多主体识别,用户可以"以图找货",快速匹配相似商品;在视频处理场景中,可以通过语义检索精准定位到视频中的目标画面,实现秒级直达。
结合 OpenSearch 提供的电商图搜与视频精准定位能力,企业可实现商品拍摄搜、视频关键帧索引等场景应用。这类应用不仅大幅提升了检索的准确性与响应速度,还带来更直观、高效的交互体验,为电商推荐、体育赛事分析、影视版权管理等提供了强大动力支撑。
技术亮点三:NL2SQL技术突破,提升自然语言查询能力
在自然语言搜索领域,阿里云 OpenSearch-SQL 为用户带来了"所问即所得"的交互体验。
阿里云 OpenSearch-SQL 技术通过四模块协同架构(预处理、信息抽取、生成、优化)及多轮一致性对齐策略,有效缓解传统 NL2SQL 中的模型幻觉问题。该方案在公开 BIRD 榜单中取得领先成绩,并已应用于金融、政务等领域数据库查询场景。相关论文被 SIGMOD 会议收录,核心代码同步开源。
阿里云 OpenSearch-SQL 为企业数据库检索、业务分析、即席查询等场景提供了高效、易用、低门槛的解决方案,让非技术用户也能直接从自然语言获取精准数据洞察。
技术亮点四:DeepSearch与DeepResearch,复杂任务处理的智能体系统
针对深度搜索与科研级复杂需求,阿里云构建了 Agentic Search 智能体系统,其核心技术亮点包括:
-
动态规划与多工具协同:通过 Retrieval Router、Retrieval Agents 及 MCP工具链,实现任务分解、多轮工具调用与结果修正;
-
多层级 Memory 系统:引入 Memory LLM 插件,在客户数据上微调小型模型,辅助大模型理解垂直场景,复杂问题解决率提升33%;
-
全流程自动化:从背景调查、任务规划到报告生成,系统支持动态迭代与纠错,已在科研文献分析、金融尽调等场景落地。
这些能力让 AI 搜索不仅能"找答案",还能"做研究",真正执行从信息收集、加工到输出的一条龙任务。
在 Deep Search/Research 的执行过程中,阿里云将任务处理拆分为背景调查---规划执行---报告生成 三个阶段。这一流程确保了从用户提问到成果产出的全过程可控、精确与高效,特别适合多步推理和复杂研究类任务。具体流程图如下:
在权威基准评测中,阿里云 Deep Search/Research 展现了强大的跨任务适应性和复杂问题处理能力。无论是在多轮深度检索任务(BrowseComp)、多跳推理任务(HotpotQA),还是综合搜索评估(Xbench-DeepSearch)中,该方案都稳居行业前列,并较传统单步 RAG 模式实现大幅性能提升。这证明了其在任务分解、多工具协作、记忆驱动推理等创新机制上的显著优势,为科研分析、竞争情报、深度数据研究等高难度应用场景提供了更高准确率与更稳健的解决方案。
在实际应用中,阿里云 Deep Search/Research 不仅能完成多步信息检索与深度分析,还能将推理链路全过程透明化展示,并生成结构化、多格式的成果报告。从推理步骤和工具调用,到 Markdown 文本和可视化图表,再到网页端交付,整个过程实现了 从任务分解 → 数据分析 → 多端成果交付 的闭环。
这种全链路能力,使其在商业调研、市场分析、科研报告等场景中,既保证了分析过程的可追溯性,又提升了结论呈现的专业度与可用性。
技术驱动场景:全栈能力助力行业智能化升级
阿里云搜索技术体系的核心价值在于技术深度与场景广度的结合:
-
生态共建:持续在 HuggingFace、GitHub 等平台输出 Ops-MM-embedding 模型、OpenSearch-SQL工具链等核心能力;
-
产品化能力:OpenSearch 平台集成向量检索、多模态搜索、智能推荐等全栈功能,服务超10万企业客户,日均处理搜索请求超50亿次;
-
行业赋能:未来将进一步深化大模型与搜索技术的融合,助力医疗、法律、智能制造等领域实现智能化升级。
结尾
"AI搜索已从'信息匹配'迈向'智能决策',阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。"
阿里云 AI 搜索的演进,展示了搜索领域从关键词匹配 → 语义理解 → 多模态融合 → 多 Agent 协作研究 的技术飞跃。
无论是精准的电商图搜、智能化的视频搜索、多源异构的数据整合,还是深度多步的分析研究,Agentic Search 都能为用户带来更高效、更智能、更贴合需求的结果。面向未来,AI 搜索是企业和个人应对信息洪流的智能导航仪,也即将进入真正的、智慧搜索时代。