作者:来自 Elastic Pete Galeotti, Yuvraj Gupta 及 Rachel Forshee

我们已将 AWS 上的 Elasticsearch Serverless 基础设施升级为更新、更快的硬件。了解这一巨大的性能提升如何带来更快的查询、更好的扩展能力以及更低的成本。
使用 Elastic Cloud Serverless 解放你自己,远离运维负担。自动扩展,应对负载高峰,专注于构建 ------ 开始 14 天免费试用,亲自体验!
你可以按照这些指南来构建 AI 驱动 的搜索体验,或在业务系统和软件之间进行搜索。
Elastic Cloud Serverless 已经是希望在无需管理基础设施运维负担的情况下,构建高效搜索和 AI 应用的开发者的权威解决方案。现在,我们正将你的 serverless 项目的性能提升到一个全新的水平。
我们已为所有运行在 AWS 上的 Elastic Cloud Serverless 项目完成了一次重大的基础设施升级,迁移到更新、更快的硬件。这一变更已自动推送到每一个 serverless 项目。它为 AWS 上的 Elasticsearch、Elastic Observability 和 Elastic Security serverless 项目带来了更高的吞吐量和更低的延迟。
为开发者带来的关键性能优势
全新的 AWS 硬件基础设施支撑着你使用 Elastic Cloud Serverless 所做的一切,为你的应用速度和响应能力带来切实的收益。
降低查询延迟 ...... 提升吞吐量
改进后的硬件大幅提升了计算资源的速度,这意味着你 的搜索查询比以往任何时候都处理得更快。
- 搜索与向量搜索 :无论你 运行的是传统的全文查询,还是用于生成式 AI 和检索增强生成( RAG )应用的前沿向量搜索,你都会看到明显的延迟下降。内部基准测试显示,搜索延迟平均降低了 35%。
- 更快的索引:数据摄取速率得到优化,使你能以更高的吞吐量索引海量数据和复杂文档。这对于需要近实时数据可见性的应用至关重要。内部基准测试显示,索引吞吐量平均提升了 26%。
高负载下的稳定性能
Elastic Cloud Serverless 旨在实时动态自动扩展以满足需求,无论你 的工作负载如何,都能将延迟降到最低。随着这次硬件升级,这种扩展能力现在变得更加高效和灵敏。
- 轻松应对突发高峰:无论你 面临的是用户流量的突然激增,还是大规模批量数据摄取,全新的基础设施都能确保你 的搜索和索引资源更高效地扩展,从而保持持续的低延迟。
- 优化的计算与存储解耦:serverless 架构将计算和存储分离,使工作负载能够独立扩展,从而实现最佳性能和成本效率。更快的硬件增强了计算层,最大化了这种解耦设计的效率。
幕后揭秘:内部基准测试结果
为了量化 AWS 基础设施升级的影响,Elastic 工程团队对一系列 serverless 工作负载进行了全面的内部基准测试。这些工作负载提供了性能提升的实证证据,无论你的应用场景如何,你都可以预期类似的性能改进。
基准测试方法
我们的测试重点是直接影响开发者体验和应用响应性的关键指标:搜索和索引操作的响应时间(即延迟)和吞吐量。
-
测试工作负载 :测试包括用户应用典型的高并发搜索操作、复杂的向量搜索查询,以及用于可观测性和安全用例的大规模数据摄取/索引。特别地,我们的测试方法使用了 Elastic 基准工具 Rally 的公开数据集。
-
wikipedia:从 Wikipedia 文本内容快照衍生的数据集,用于衡量通用文本搜索性能。
-
MSMARCO-Passage-Ranking:从 Microsoft 的 Machine Reading Comprehension (MS MARCO) 衍生的数据集,用于衡量稀疏向量字段的搜索性能。
-
OpenAI_Vector:从 BEIR 的 NQ 衍生并使用 OpenAI 的 text-embedding-ada-002 模型生成 embedding 的数据集,用于衡量密集向量字段的搜索性能。
-
-
测量方法:我们比较了旧基础设施和新基础设施的性能,测量了第 99 百分位延迟(P99)以捕获最差情况的尾延迟性能,以及每秒操作数。每条测试轨道在每种硬件配置下运行五次,以确保结果一致性。
-
目标 :我们的目标是验证基础设施在快速自动扩展期间,也能在整体上提供持续更快和更可预测的性能。
性能数据总结
结果确认了效率和速度的显著提升。这些提升直接转化为用户的响应时间降低,以及由于能够以更少的计算资源完成相同工作量而降低的运营成本。
以下表格详细说明了量化改进。吞吐量越高越好;延迟越低越好。
搜索基准测试结果:
| 基准测试 | 对比 | 旧基础设施 | 新基础设施 | 差异 |
|---|---|---|---|---|
wikipedia (纯文本) |
搜索操作吞吐量 (ops/s) | 729 | 1107 | +52% |
wikipedia (纯文本) |
搜索操作延迟 (p99, ms) | 56 | 35 | -37% |
MSMARCO-Passage-Ranking (稀疏向量) |
搜索操作吞吐量 (ops/s) | 22 | 31 | +40% |
MSMARCO-Passage-Ranking (稀疏向量) |
搜索操作延迟 (p99, ms) | 108 | 67 | -38% |
OpenAI_Vector (密集向量) |
搜索操作吞吐量 (ops/s) | 475 | 624 | +31% |
OpenAI_Vector (密集向量) |
搜索操作延迟 (p99, ms) | 35 | 22 | -37% |
索引基准测试结果:
| 基准测试 | 比较 | 旧基础设施 | 新基础设施 | 差异 |
|---|---|---|---|---|
wikipedia (纯文本) |
索引操作吞吐量 (ops/s) | 2845 | 3220 | +13% |
wikipedia (纯文本) |
索引操作延迟 (p99, ms) | 1769 | 1120 | -37% |
MSMARCO-Passage-Ranking (稀疏向量) |
索引操作吞吐量 (ops/s) | 7087 | 8900 | +26% |
MSMARCO-Passage-Ranking (稀疏向量) |
索引操作延迟 (p99, ms) | 824 | 677 | -18% |
OpenAI_Vector (密集向量) |
索引操作吞吐量 (ops/s) | 2972 | 3187 | +7% |
OpenAI_Vector (密集向量) |
索引操作延迟 (p99, ms) | 2946 | 2944 | 0% |
额外好处:成本降低
虽然我们专注于提供低延迟性能,但新硬件的高效率也直接正面影响 Elasticsearch 项目的成本。
Elasticsearch Serverless 的定价基于使用量,这意味着你只需为你消耗的 ingest 和 search 资源付费。由于更新、更快的硬件更高效,你的工作负载通常可以使用更少的资源完成任务,从而为大多数项目带来固有的成本降低。你可以在不支付额外价格的情况下获得性能提升------这就是优化效率的定义。
这对你开发者意味着什么?
此基础设施升级完全由 Elastic 管理,所以你无需动手 ------ 无需迁移,也无需配置更改。提升在所有基于 AWS 的 serverless 项目上都是即时且自动的。
这次升级让你能够:
-
构建更快速的应用:专注于功能开发速度,同时知道你的底层搜索平台能提供用户所需的速度。
-
自信创新:部署新的搜索、可观测性和安全功能------包括复杂的 AI 功能,如向量搜索和相关性排序------并确保平台在高峰期依然可以高性能处理负载。
-
简化你的技术栈:使用完全托管的服务处理基础设施管理、容量规划和扩展,让你专注于代码和数据。
原文:https://www.elastic.co/search-labs/blog/elasticsearch-serverless-aws-performance-boost