官宣 | Milvus 2.6云上GA:三层存储降本85% 、速度快ES 4-7 倍,多数据类型支持

好消息,大家翘首以盼的Milvus 2.6.x 正式登陆Zilliz Cloud啦!

此次上线不仅完整迁移开源版本的全部功能,还叠加了一系列Zilliz Cloud专属优化,在性能、稳定性和效率实现进一步突破。

功能上,伴随此次GA,用户可享受三方面的体验升级:

成本侧:三层分层存储架构正式上线,可将存储成本降低 87%,计算支出减少 25%,整体 TCO 接近 S3 水平;此外,我们还推出了Index Build Level索引构建三档策略(精度优先 / 平衡 / 容量优先),可以自动匹配不同场景的精度与成本需求。

性能与体验上:我们推出了JSON shredding 和 JSON path index 让元数据过滤提速 100 倍;最新的BM25 全文搜索比 Elasticsearch 快 4-7 倍,支持在一个系统内同时完成内关键词 + 向量混合检索;并增强了多语言支持,优化中日韩等复杂分词场景的搜索精度。

场景扩展方面:我们新增了地理空间数据Geometry、带时区时间戳(TimestampTz)、8 位向量类型(INT8 Vector Type)、Struct等数据类型,用户无需配置其他工具即可支持位置检索、时序分析、复杂实体建模等场景,简化您的整体数据架构设计。

以下是此次Zilliz Cloud功能更新的详细介绍:

01

三层存储上线:向量搜索成本降至接近 S3 水平

相信以下场景,很多朋友都很熟悉:

多租户SaaS场景:一个拥有上千租户的产品中,过去 24 小时内被访问的租户占比通常只有 15%上下,而剩余 85% 的租户数据几乎不会被唤醒。

电商推荐场景:电商的SKU通常百万起步,但Top 10%热门商品贡献了 80% 的查询量,长尾商品的访问频率低到可以忽略不计

内容查询场景:社交平台的历史内容向量库中,90% 的查询集中在最近 7 天产生的内容上,而归档内容(占总量的 95%)几乎不会被访问。

本质上,这些场景都存在一个共性问题:仅贡献不到10%查询调用的冷数据,往往占据了80%的内存资源。

而在Milvus 2.5及更早版本中,无论数据是否会被访问,都必须全量加载到本地(内存或磁盘)。这就导致一个尴尬的结果:即便大部分资源处于闲置状态,用户仍需为这些无效占用支付高昂成本。

伴随着Milvus 2.6的推出,以及相关功能的正式GA上云,传统的全量预加载将正式转变为按需加载,将数据存储成本压缩到极致。

技术路径实现上,Milvus 2.6.x 的分层存储功能,在 Zilliz Cloud 中被升级为全云原生三层架构:

  • 内存层承载热数据,支持毫秒级查询响应

  • 本地 SSD 缓存温数据,加速重复访问请求

  • 对象存储(如 S3)存放全量数据,保障低成本

此外,系统基于LRU(最近最少使用)算法的智能预测,可以动态调整冷热数据边界,自动降级不常用数据块。让数据在各层级间自动流转。

生产环境测试显示,其缓存命中率超 90%,能降低 87% 存储成本和 25% 计算支出。一个 10TB 的数据集,月均成本可从 3000 美元降至 400 美元。

从场景角度出发,该方案非常适配冷热数据二八分(热数据占比不到20%,但贡献80%以上访问的)的长尾场景,比如电商产品搜索、企业文档库、新闻媒体库等冷热数据分明的场景。

02

Index Build Level:自动平衡搜索精度与存储成本

索引选择通常会直接决定我们向量搜索的成本与召回结果,通常:精度要求越高,索引体积越大,内存占用越高。

但值得注意的是,并非所有场景都需要极致召回率。

因此,Zilliz Cloud 推出了全新的Index Build Level索引构建级别功能,支持按需选择平衡策略:

精度优先:面向欺诈检测等关键任务,提供最高召回率

平衡型(默认):精准匹配精度、性能与内存效率,适配多数通用 AI 应用

容量优先型:深度优化存储密度,适合冷数据归档、实验环境等低精度需求场景

在这背后,Zilliz Cloud构建了新一代量化引擎,可自动且动态的调整索引压缩和结构,从而在大小、准确性和成本之间实现平衡。

03

扩展数据类型支持:适配更多真实 AI 场景

过去在Zilliz Cloud 以及Milvus使用中,需要位置感知搜索、时序过滤等需求时,我们只能额外搭配 GIS 工具或时序数据库。

现如今,Milvus 2.6.x 新增了多种数据类型,让这些场景可直接在 Zilliz Cloud 内实现,并极大简化了您的数据管理架构与运维成本。

地理空间数据Geometry(POINT、LINESTRING、POLYGON):支持语义相似度与地理空间过滤的混合检索,无需额外部署 GIS 引擎,适配配送、电商附近推荐等场景。

带时区时间戳(TimestampTz):原生支持时间窗口搜索、时效性加权排序,为日志分析、监控告警等场景提供简洁处理流程。

8 位向量类型(INT8 Vector Type):完美适配 E5-base、MiniLM-L12 等模型的输出格式,无需格式转换,减少内存与存储浪费,适合边缘 AI 与成本敏感型负载。

Struct:在多个向量代表一个实体的场景中(如电商场景,一个商品可能包含多个角度的图片和描述),Struct 允许将不同类型的数据(如标量、向量、字符串等)组织成一个结构化的对象。通过这种方式,数据库中的"一行"可以对应业务中的"一个实体"(如商品、文章、视频等)。结合 MAX_SIM 等聚合函数,数据库能够直接返回实体级的结果,简化查询语句和数据模型设计。

04

JSON Shredding与 JSON Path:元数据过滤提速 100 倍

电商推荐、RAG 系统等场景高度依赖 JSON 标量过滤(产品详情、用户属性、文档标签、事件日志、偏好设置、配置)过滤,但传统方案需扫描全量 JSON 对象,数据量增长后性能会急剧下降。

Zilliz Cloud 的 Milvus 2.6.x 凭借两项特性解决这一痛点:

JSON Shredding:写入侧依然保持标准 JSON 写入方式,但 Zilliz Cloud 会在底层自动重构 JSON,即便大型或结构混乱的文档,也能实现过滤速度提升 100 倍。

JSON Path:支持为 price、category 等核心字段建立索引,实现等值、范围查询的即时响应。

两者结合让结构化过滤与向量搜索在同一系统内完成,大幅提升检索精度,适配推荐系统、多租户架构等场景。

05

BM25 优化全文搜索:速度较 Elasticsearch 快 4-7 倍

企业知识助手、客服机器人等 RAG 应用,需要向量语义检索与关键词精确匹配的双重能力。

此前,用户需同时部署向量数据库与 Elasticsearch,才能兼顾两种需求,导致成本翻倍、检索链路变长。

Zilliz Cloud 在 Milvus 2.5.x 混合搜索基础上完成升级,内置优化版 BM25 全文引擎:

  • 检索速度较 Elasticsearch 快 4 倍,特定数据集可达 7 倍

  • 索引体积仅为原始文本的 1/3

  • 能在单一系统内实现关键词+向量的统一检索

这一能力让 RAG 应用的事实锚定更精准,比如实现精确匹配名称、缩写、法规和错误代码、产品名称、版本号、配置参数......尤其适配企业知识管理、客户支持文档检索等场景。

06

增强多语言支持:服务全球用户,提升复杂文本搜索效果

全球化成为AI原生应用成立第一天就必须面对的现实,而面向全球市场的 AI 应用,分词能力会直接决定其搜索质量。

Milvus 2.6.x 针对中日韩等分词复杂的语言完成专项优化,并在 Zilliz Cloud 中提供开箱即用的配置。

核心升级包括:

  • 集成 Lindera + ICU 分词器,优化日语、韩语及混合语言的分词效果

  • 支持自定义词典的Jieba 分词,可针对行业术语优化中文检索

  • 提供 run_analyzer 工具,帮助团队调试分词行为,保障搜索质量稳定

此外,Zilliz Cloud 新增短语匹配(Phrase Match,以倒排索引为基础 ,可实现严格词序 + 位置信息 ,也支持 灵活距离调节)、索引功能,可加速子串、通配符等复杂文本查询,适配全球电商、跨国企业知识平台等场景。

07

安全合规与全球高可用

随着 Milvus 2.6.x 上线,Zilliz Cloud 进一步巩固了高性能、低成本、高安全的全托管向量数据库服务定位,为 AI 应用提供全链路支撑:

  • 弹性扩展:一键部署、无服务器自动扩缩容、按需付费

  • 先进搜索能力:覆盖向量、全文、混合搜索,支持元数据过滤与动态 schema

  • 企业级安全合规:99.95% SLA、SOC 2 Type II、ISO 27001 认证,支持 GDPR、HIPAA 合规与 RBAC 权限管理

  • 全球部署:在 AWS、GCP、Azure 、阿里云、腾讯云五大云平台上线,实现全球范围内低于 100 毫秒延迟

  • 无缝迁移:内置工具支持从 Pinecone、Qdrant、Elasticsearch 等平台迁移数据

  • 自然语言查询:支持 MCP 服务器,无需复杂 API 即可实现直观检索

这些能力让 Zilliz Cloud 超越单纯的向量数据库范畴,成为一套全托管、生产就绪的 AI 应用开发平台。

08

如何体验 Zilliz Cloud ?

Milvus 2.6.x 所有新功能已在 Zilliz Cloud 全面上线。

如果您已有账号:直接登录即可使用,无需数据迁移或版本升级

新用户:注册即享 300人民币免费额度,体验全球领先的托管向量数据库(扫描文末二维码即可)

如有疑问,可查阅官方文档或联系 Zilliz 支持团队(扫描文末二维码即可)

go 复制代码
阅读推荐
不会做RAG、agent的本地数据管理?都来学Claude Code!附深度拆解
索引选不对,成本贵十倍!ScaNN就是电商推荐的最优解
都有混合检索与智能路由了,谁还在给RAG赛博哭坟?
prompt比拖拉拽更适合新手做复杂agent!LangSmith+Milvus教程
多agent系统实战之:Agno与LangGraph,谁更适合快速落地生产?
相关推荐
Dxy12393102162 小时前
深度解析 Elasticsearch 8.13.4 范围查询 DSL
大数据·elasticsearch
PNP Robotics2 小时前
PNP机器人分享具身操作策略和数据采集
大数据·人工智能·学习·机器人
企业智能研究3 小时前
数据治理是什么?数据治理对企业有什么价值
大数据·人工智能
金士镧(厦门)新材料有限公司3 小时前
稀土抑烟剂:让PVC膜“安静”又安全
科技·安全·全文检索·生活·能源
峥嵘life4 小时前
Android16 系统每月Google安全补丁导入说明
大数据·elasticsearch·搜索引擎
Dxy12393102164 小时前
Elasticsearch 8.13.4 地理范围查询实战指南
大数据·elasticsearch·jenkins
alin、m4 小时前
银河麒麟(Kylin) - V10 SP1桌面操作系统ARM64编译 draw.io 画图工具
大数据·kylin·draw.io
天草二十六_简村人4 小时前
ES索引检索课程名称时,同时支持模糊搜索和精准搜索
大数据·后端·elasticsearch·搜索引擎·全文检索
sld1685 小时前
S2B2B系统:多级分销与渠道管理的数字化利器
大数据·人工智能