全新启航!阿里云向量检索服务Milvus版正式上线!

今天,阿里云正式宣布向量检索服务Milvus版在杭州、上海、北京、深圳四大region正式可用并开放公测!这是由阿里云与产品生态合作伙伴Zilliz联合推出的一款业内领先的云原生向量检索引擎。向量检索服务Milvus版在上一代EMR Serverless Milvus 公测版的基础上全新升级并继续提供公测服务,不仅继续100%兼容开源版内核,同时联合ZIlliz提供更强大的商业化内核,极致的存算优化,使得性能得到3倍以上提升,资源节约30%以上,更与PAI-EAS、通义等阿里云AI产品打通,并全面兼容LlamaIndex,提供友好易用的RAG解决方案。

现在向量检索服务Milvus版提供独立产品控制台、售卖入口和帮助文档,用户可以在全新的产品详情页上了解服务,并进行免费的公测使用。

极致存算优化带来的数倍性能提升

向量检索服务Milvus版通过技术上的存算优化,较Milvus社区版有着数倍的性能提升。具有Cardinal商业内核,整合了最实用、最流行的 ANNS 方法,具备高效的计算资源使用率,通过大量可调整参数适配多种场景,能够默认自动调整参数适配不同的场景,在保持合理精度(召回率)的同时最大化搜索速度(QPS,每秒查询数)。体现在向量检索中的索引类型上,向量检索服务Milvus版提供功能更强大AUTOINDEX索引,对比HNSW、IVF等开源索引,用户无需再花费时间精力调优索引参数,AUTOINDEX索引可以自适应优化索引参数,一种索引适配多种场景,用户只需聚焦于业务本身,减轻调参压力。同时,提供远超开源内核的高性能的 ANN 算法、稀疏查询算法等能力。在工程上进行了大量优化,相同场景下引擎性能(QPS)是开源社区版的10倍,召回率一致的情况下QPS有5倍提升,而综合考虑QPS和召回率也可实现8倍的提升。同时对计算、存储资源进一步降低,可达到至少30%的自建Milvus上云成本缩减。通过开源向量数据库性能测试工具对向量检索服务Milvus版和社区版进行评估测试,结果如下:

云原生企业级的护航服务

向量检索服务Milvus版提供全托管免运维的向量检索引擎服务。100%兼容开源,支持开源用户平滑迁移上云,开箱即用,用户能够一键调整集群配置。根据专业技术团队评估,自建Milvus服务依赖至少2-3位专业开发及运维工程师耗费月余完成业务搭建,并且需要投入1/3的人力持续运维,而使用阿里云向量检索服务Milvus版则可在10min内完成集群资源搭建,立即进入业务开发状态,几天内让开发人员快速完成业务开发和接入,并持续稳定运行,极大地降低用户的使用门槛和前期投入。

同时,向量检索服务Milvus版在安全可用上提供99.9%可用性SLA(公测期免费,不保证SLA),有着丰富的安全策略,拥有更细粒度的角色权限访问控制和组织管理,云上自研技术提供Kubernetes集群监控告警等系统,保证在业务波动情况下集群稳定运行。同时阿里云同Zilliz技术团队一起为用户提供更全面的服务支持,用户无须依赖有丰富经验的架构与运维人员,可将大部分精力投入到业务中去。

拥抱阿里云与AI双生态的便捷体验

在阿里云上,向量检索服务Milvus版无缝集成于PAI-EAS产品,通过EAS的Web UI,帮助用户快速搭建功能丰富、简单易用的RAG解决方案。用户只需要经过简单的配置,就可以快速运行一个知识问答助手。除此之外,还可以通过API调用的方式和通义大模型、魔搭社区打通,非常方便的使用各种大语言模型,享受阿里云AI平台为开发者提供的各种工具。在开源社区内,Milvus原生接入LangChain和LlamaIndex框架,用户在云上也可以直接使用开源AI生态的各种工具,在自带的PythonSDK下,体验非常友好。

首战告捷

公测期间阿里云Milvus成功助力识货搭建电商向量数据检索平台。识货成立于2012年6月,是虎扑旗下的国内领先的电商平台,产品覆盖国内外主流购物商,搜索引导的成交占比全部成交的50%以上,是站内最重要的功能之一。通过与识货技术团队多次协同配合,阿里云Milvus为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。实现了亿级别数据准实时检索,毫秒级别查询响应,同规格QPS对比自建提升10%。同时提供开箱即用的全托管服务,极大的缓解了运维人力和精力负担。

现在,阿里云向量检索服务Milvus版为非结构化数据处理提供全链路解决方案,在整个链路中,从向量索引、工程算法优化、弹性扩缩容、全链路非结构化Pinepline等多个方向进行大量优化,目前已经成功应用于相似性检索、多模态检索,大语言模型中的检索增强生成等场景中。

相关推荐
Cx330❀13 分钟前
从零实现Shell命令行解释器:原理与实战(附源码)
大数据·linux·数据库·人工智能·科技·elasticsearch·搜索引擎
岱宗夫up14 分钟前
.env 文件是干啥的?为什么不能提交到 Git?
大数据·git·elasticsearch·搜索引擎·gitee·github·gitcode
Guheyunyi9 小时前
智能守护:视频安全监测系统的演进与未来
大数据·人工智能·科技·安全·信息可视化
小魏小魏我们去那里呀9 小时前
Alibaba Cloud DevOps Integration For JetBrains 插件使用指南
ide·阿里云·devops·jetbrains
发哥来了9 小时前
主流AI视频生成商用方案选型评测:五大核心维度对比分析
大数据·人工智能
数研小生10 小时前
做京东评论分析系统11年,京东评论数据接口解析
大数据
金融小师妹10 小时前
基于LSTM-GARCH-EVT混合模型的贵金属极端波动解析:黄金白银双双反弹的逻辑验证
大数据·人工智能·深度学习·机器学习
yumgpkpm12 小时前
2026软件:白嫖,开源,外包,招标,晚进场(2025年下半年),数科,AI...中国的企业软件产业出路
大数据·人工智能·hadoop·算法·kafka·开源·cloudera
xixixi7777713 小时前
今日 AI 、通信、安全行业前沿日报(2026 年 2 月 4 日,星期三)
大数据·人工智能·安全·ai·大模型·通信·卫星通信
蓝队云计算14 小时前
蓝队云部署OpenClaw深度指南:避坑、优化与安全配置,从能用做到好用
运维·安全·云计算