2025年9月26日,在杭州云栖大会"AI搜索与向量引擎"分论坛上,阿里云智能集团高级技术专家------贾新禹 正式发布 Elasticsearch Serverless 2.0 ,并首次系统性阐述其技术架构与产品价值。这一全新升级的Serverless解决方案,以"极致弹性、智能核心、AI生态融合 "三大技术基石,直面AI搜索时代的工程化挑战,为企业提供一站式构建AI搜索能力的基础设施。 
时代鸿沟:AI搜索需求升级与工程落地的矛盾
贾新禹指出,随着语义搜索、多模态检索等能力从"加分项"变为行业标配,企业面临着一道显著的工程鸿沟:开发者不仅要满足高性能、低成本的业务需求,还必须投入大量资源到模型调优、量化算法设计、混合排序等全新的复杂领域,这直接导致开发周期漫长、运维成本高昂 。Elasticsearch Serverless 2.0 的核心使命,就是通过将这些技术复杂度封装至底层,让开发者能够回归业务创新。

技术基石一:极致弹性基座,持续进化的核心能力
Elasticsearch Serverless 2.0 其核心之一,是为用户提供了一个"极致弹性、持续进化"的 Serverless 基座,让企业无需关注底层版本迭代,即可无缝获取最新能力。
-
极致弹性:通过将弹性调度下沉至引擎,实现了亚秒级弹性响应。面对流量洪峰,服务平稳无抖动,确保业务连续性。
-
无感进化 :无感集成社区与阿里云最新技术特性。例如,引入 ES 9 的 FilterKNN 优化 ,使向量检索性能提升 5倍 ;采用 Lucene 10 的 Merge 算法 ,让 Merge 性能提升 2倍;目前已集成超 30个 817 以上版本新特性。
-
深度优化 :基于云环境持续进行软硬件协同优化。例如,通过与 JDK 及倚天团队合作,针对 int8 量化查询性能分别提升了 30% 和 50%。


技术基石二:内置专家经验的智能核心,化繁为简
针对搜索系统调优门槛高的痛点,Serverless 2.0 内置了智能核心引擎,将专家经验产品化。
-
智能策略自动调优 :内置专家级优化策略,如自动在
_source中排除向量字段、默认启用 int8 量化,在保障核心召回精度的同时,可节省 70% 的存储和 75% 的内存。 -
专家级智能 Agent :基于 LangGraph 实现的智能 Agent,能复刻专家经验。例如,它能智能推断 RDS 中的
int类型字段delete_status为状态字段,并自动优化为更利于过滤和聚合的keyword类型。 -
查询模板自动生成 :Agent 能根据业务场景,自动生成复杂的查询模板。例如,在商品检索场景下,可一键生成融合了文本、向量、多模态的三路 RRF 查询模板,大幅降低新技术使用门槛。

技术基石三:AI生态深度整合,端到端能力全托管
Elasticsearch Serverless 2.0进一步打通阿里云AI搜索生态,构建端到端AI搜索闭环 ,开发者无需再拼凑和运维分散的 AI 服务。

-
无缝集成 AI 平台 :无缝集成阿里云 AI 搜索开放平台 ,提供丰富的搜索专属大模型。这并非通用模型,而是经过大量真实搜索场景打磨的专属模型,让检索和生成效果更专业。
-
零运维的向量链路 :平台提供从数据导入、向量化、索引构建到查询生成的全链路托管,让开发者无需关心复杂的向量链路搭建与运维。

未来展望:Serverless 2.0 让业务回归业务
贾新禹总结称,Elasticsearch Serverless 2.0的核心价值在于通过将弹性、调优和 AI 能力彻底平台化,让企业能从繁重的工程细节中解放出来,真正聚焦于业务创新。这不仅是一次技术升级,更是对开发者生产力的一次彻底解放,将有力推动 AI 搜索技术的普惠化应用。
