RAG 向量存储月费 800 刀?S3 Vectors 直接砍到 100 出头

RAG 向量存储成本是个老问题了。OpenSearch 3 节点集群每月 $500+,其实 90% 的时间没什么查询量------但集群不能停。

Amazon S3 Vectors 解决的就是这个问题:向量存在 S3 上,按用量付费,没查询时几乎不花钱。

核心概念

  • Vector Bucket:专门存向量的 S3 桶
  • Vector Index:定义维度和距离函数(cosine/euclidean/dotProduct)
  • 支持 metadata 过滤
  • 维度上限 4096

快速上手

python 复制代码
import boto3
s3v = boto3.client('s3vectors', region_name='us-east-1')

# 创建
s3v.create_vector_bucket(vectorBucketName='my-rag')
s3v.create_vector_index(
    vectorBucketName='my-rag',
    indexName='docs', dimension=1536, distanceMetric='cosine'
)

# 写入
s3v.put_vectors(
    vectorBucketName='my-rag', indexName='docs',
    vectors=[{'key': 'doc-1', 'data': {'float32': emb}, 'metadata': {'text': chunk}}]
)

# 查询
results = s3v.query_vectors(
    vectorBucketName='my-rag', indexName='docs',
    queryVector={'float32': q_emb}, topK=5
)

成本对比

方案 100万向量/每天 1万查询
OpenSearch 3节点 ~$500+/月
S3 Vectors ~$20-50/月

低频查询场景下节省 80%+ 成本。

适用场景

  • RAG 知识库(写少读多)✔
  • 图片/文档相似度搜索 ✔
  • 对延迟要求 <10ms 的场景 ✘(用 OpenSearch)
  • 频繁更新向量数据 ✘(用 OpenSearch)

对于大多数 RAG 场景,S3 Vectors 够用且便宜很多。


🔗 Amazon S3 Vectors:aws.amazon.com/cn/s3/featu...

相关推荐
Old Uncle Tom17 分钟前
OpenClaw 记忆系统 -- 记忆预加载
java·数据结构·算法·agent
小小小米粒29 分钟前
Collection单列集合、Map(Key - Value)双列集合,多继承实现。
java·开发语言·windows
摇滚侠1 小时前
expdp 查看帮助
java·数据库·oracle
:1212 小时前
java基础
java·开发语言
曹牧2 小时前
Spring:@RequestMapping注解,匹配的顺序与上下文无关
java·后端·spring
daixin88482 小时前
cursor无法正常使用gpt5.5等模型解决方案
java·redis·cursor
韦禾水3 小时前
记录一次项目部署到tomcat的异常
java·tomcat
曦月合一3 小时前
树莓派安装jdk、tomcat、vnc、谷歌浏览器开机自启等环境配置
java·tomcat·树莓派
此剑之势丶愈斩愈烈4 小时前
openssl 自建证书
java
面汤放盐4 小时前
何时使用以及何时不应使用微服务:没有银弹
java·运维·云计算