云栖实录 | 阿里云助力金山办公打造智能搜索新标杆:WPS云文档搜索技术全面升级

随着大模型时代到来,用户需求从"关键词匹配"转向"自然语言交互与问答式搜索"。2025年9月26日,杭州云栖大会"AI搜索与向量引擎"分论坛上,金山办公云搜索技术总监------陈海荣 宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

此次升级以阿里云Elasticsearch混合检索与AI语义搜索能力为核心,全面解决海量文档场景下的检索效率、语义理解与成本优化难题,为全球6.32亿月活用户提供"秒级响应、语义直达"的智能搜索体验。

关于金山办公

金山办公(Kingsoft Office)是全球领先的办公软件、服务与解决方案提供商,旗下产品包括WPS Office、金山文档等,服务全球超6.32亿月活用户,覆盖220多个国家和地区,致力于以技术创新推动办公智能化转型。

深耕技术迭代:从基础架构到语义搜索的跨越

作为拥有2625亿云文档、服务全球220余个国家和地区的企业级应用,WPS云文档搜索功能历经三次技术革新 。早期版本面临"搜不到、排不准、响应慢"等挑战:1.0版本通过自研QU引擎、分词器及高亮算法,将首屏点击率从53.7%提升至69.8%,MRR(平均倒数排名)翻倍至0.52;2.0版本依托阿里云ES索引优化、跨集群网关等技术,实现查询P99延迟<350ms,集群稳定性显著提升,支撑千亿级文档规模下的高效检索。

金山办公云搜索技术总监陈海荣指出:"用户不再局限于文件名检索,而是希望输入'项目Q3营收数据'或'公司规章制度'等语义指令,直接获取结构化答案。"这一转变推动WPS搜索进入3.0时代。

阿里云技术赋能:混合检索与AI原生架构

在3.0版本中,金山办公联合阿里云Elasticsearch构建"语义搜索+向量检索"的混合技术架构,实现三大突破:

  1. 文档AI原生化: 通过多维度AI解析引擎,对文档内容进行语义标签化处理,提升文档理解深度;
  2. Query意图精准识别: 基于大模型的自然语言处理能力,实现搜索意图分流,支持"全库问答""文档关联检索"等场景;
  3. 冷热数据智能管理: 依托阿里云ES冷热索引策略,将向量检索内存资源需求降低70%、CPU消耗减少50,同时通过自动化的写入/查询Pipeline,实现业务无感的高效成本控制。

以实际场景为例,用户输入"新人如何申请休假"时,系统可自动关联公司制度文档并提取关键流程;输入"项目A季度总结"时,AI直接从相关文档中抽取数据生成摘要,真正实现**"告别盲找,一步直达答案"**。

未来展望:AI搜索生态的全球布局

金山办公与阿里云的深度合作,不仅优化了搜索技术架构,更重塑了智能办公场景的用户体验。未来,双方计划进一步融合多模态检索、实时协同搜索 等能力,并拓展至企业知识库管理、跨语言文档检索等全球化场景。 "阿里云Elasticsearch的混合检索能力与技术前瞻性,是支撑WPS搜索持续领先的关键。" 陈海荣表示。作为企业级搜索领域的标杆案例,WPS云文档的技术升级为行业提供了可复用的智能化升级路径------从底层架构优化到上层语义交互创新,阿里云持续以"技术+场景"双轮驱动,赋能企业构建下一代智能搜索生态。

相关推荐
划水的code搬运工小李13 分钟前
EVO评估数据导出在origin中绘制
人工智能
Clarence Liu13 分钟前
机器学习(5) 梯度下降
人工智能·机器学习
kisshuan1239615 分钟前
电信杆塔类型识别与分类_fovea_r101_fpn_4xb4-2x_coco模型详解_模型训练与验证_通俗易懂!入门必看系列!
人工智能·目标跟踪·分类
子午16 分钟前
【2026原创】动物识别系统~Python+深度学习+人工智能+模型训练+图像识别
人工智能·python·深度学习
o_insist21 分钟前
LangChain1.0 实现 PDF 文档向量检索全流程
人工智能·python·langchain
OpenMiniServer24 分钟前
AI + GitLab + VSCode:下一代开发工作流的革命性集成
人工智能·vscode·gitlab
脑洞AI食验员26 分钟前
智能体来了:用异常与文件处理守住代码底线
人工智能·python
Elasticsearch29 分钟前
使用 Elastic Agent 混合摄取加速 Otel 采用
elasticsearch
摘星观月30 分钟前
【三维重建2】TCPFormer以及NeRF相关SOTA方法
人工智能·深度学习
shangjian00730 分钟前
AI大模型-机器学习-分类
人工智能·机器学习·分类