更高的吞吐量和更低的延迟: Elastic Cloud Serverless 在 AWS 上获得了显著的性能提升

作者:来自 Elastic Pete Galeotti, Yuvraj GuptaRachel Forshee

我们已将 AWS 上的 Elasticsearch Serverless 基础设施升级为更新、更快的硬件。了解这一巨大的性能提升如何带来更快的查询、更好的扩展能力以及更低的成本。

使用 Elastic Cloud Serverless 解放你自己,远离运维负担。自动扩展,应对负载高峰,专注于构建 ------ 开始 14 天免费试用,亲自体验!

你可以按照这些指南来构建 AI 驱动 的搜索体验,或在业务系统和软件之间进行搜索


Elastic Cloud Serverless 已经是希望在无需管理基础设施运维负担的情况下,构建高效搜索和 AI 应用的开发者的权威解决方案。现在,我们正将你的 serverless 项目的性能提升到一个全新的水平。

我们已为所有运行在 AWS 上的 Elastic Cloud Serverless 项目完成了一次重大的基础设施升级,迁移到更新、更快的硬件。这一变更已自动推送到每一个 serverless 项目。它为 AWS 上的 Elasticsearch、Elastic Observability 和 Elastic Security serverless 项目带来了更高的吞吐量和更低的延迟

为开发者带来的关键性能优势

全新的 AWS 硬件基础设施支撑着你使用 Elastic Cloud Serverless 所做的一切,为你的应用速度和响应能力带来切实的收益。

降低查询延迟 ...... 提升吞吐量

改进后的硬件大幅提升了计算资源的速度,这意味着你 的搜索查询比以往任何时候都处理得更快。

  • 搜索与向量搜索 :无论你 运行的是传统的全文查询,还是用于生成式 AI 和检索增强生成( RAG )应用的前沿向量搜索,你都会看到明显的延迟下降。内部基准测试显示,搜索延迟平均降低了 35%。
  • 更快的索引:数据摄取速率得到优化,使你能以更高的吞吐量索引海量数据和复杂文档。这对于需要近实时数据可见性的应用至关重要。内部基准测试显示,索引吞吐量平均提升了 26%。

高负载下的稳定性能

Elastic Cloud Serverless 旨在实时动态自动扩展以满足需求,无论你 的工作负载如何,都能将延迟降到最低。随着这次硬件升级,这种扩展能力现在变得更加高效和灵敏。

  • 轻松应对突发高峰:无论你 面临的是用户流量的突然激增,还是大规模批量数据摄取,全新的基础设施都能确保你 的搜索和索引资源更高效地扩展,从而保持持续的低延迟。
  • 优化的计算与存储解耦:serverless 架构将计算和存储分离,使工作负载能够独立扩展,从而实现最佳性能和成本效率。更快的硬件增强了计算层,最大化了这种解耦设计的效率。

幕后揭秘:内部基准测试结果

为了量化 AWS 基础设施升级的影响,Elastic 工程团队对一系列 serverless 工作负载进行了全面的内部基准测试。这些工作负载提供了性能提升的实证证据,无论你的应用场景如何,你都可以预期类似的性能改进。

基准测试方法

我们的测试重点是直接影响开发者体验和应用响应性的关键指标:搜索和索引操作的响应时间(即延迟)和吞吐量。

  • 测试工作负载 :测试包括用户应用典型的高并发搜索操作、复杂的向量搜索查询,以及用于可观测性和安全用例的大规模数据摄取/索引。特别地,我们的测试方法使用了 Elastic 基准工具 Rally 的公开数据集

    • wikipedia:从 Wikipedia 文本内容快照衍生的数据集,用于衡量通用文本搜索性能。

    • MSMARCO-Passage-Ranking:从 Microsoft 的 Machine Reading Comprehension (MS MARCO) 衍生的数据集,用于衡量稀疏向量字段的搜索性能。

    • OpenAI_Vector:从 BEIR 的 NQ 衍生并使用 OpenAI 的 text-embedding-ada-002 模型生成 embedding 的数据集,用于衡量密集向量字段的搜索性能。

  • 测量方法:我们比较了旧基础设施和新基础设施的性能,测量了第 99 百分位延迟(P99)以捕获最差情况的尾延迟性能,以及每秒操作数。每条测试轨道在每种硬件配置下运行五次,以确保结果一致性。

  • 目标 :我们的目标是验证基础设施在快速自动扩展期间,也能在整体上提供持续更快和更可预测的性能

性能数据总结

结果确认了效率和速度的显著提升。这些提升直接转化为用户的响应时间降低,以及由于能够以更少的计算资源完成相同工作量而降低的运营成本。

以下表格详细说明了量化改进。吞吐量越高越好;延迟越低越好。

搜索基准测试结果:

基准测试 对比 旧基础设施 新基础设施 差异
wikipedia (纯文本) 搜索操作吞吐量 (ops/s) 729 1107 +52%
wikipedia (纯文本) 搜索操作延迟 (p99, ms) 56 35 -37%
MSMARCO-Passage-Ranking (稀疏向量) 搜索操作吞吐量 (ops/s) 22 31 +40%
MSMARCO-Passage-Ranking (稀疏向量) 搜索操作延迟 (p99, ms) 108 67 -38%
OpenAI_Vector (密集向量) 搜索操作吞吐量 (ops/s) 475 624 +31%
OpenAI_Vector (密集向量) 搜索操作延迟 (p99, ms) 35 22 -37%

索引基准测试结果:

基准测试 比较 旧基础设施 新基础设施 差异
wikipedia (纯文本) 索引操作吞吐量 (ops/s) 2845 3220 +13%
wikipedia (纯文本) 索引操作延迟 (p99, ms) 1769 1120 -37%
MSMARCO-Passage-Ranking (稀疏向量) 索引操作吞吐量 (ops/s) 7087 8900 +26%
MSMARCO-Passage-Ranking (稀疏向量) 索引操作延迟 (p99, ms) 824 677 -18%
OpenAI_Vector (密集向量) 索引操作吞吐量 (ops/s) 2972 3187 +7%
OpenAI_Vector (密集向量) 索引操作延迟 (p99, ms) 2946 2944 0%

额外好处:成本降低

虽然我们专注于提供低延迟性能,但新硬件的高效率也直接正面影响 Elasticsearch 项目的成本。

Elasticsearch Serverless 的定价基于使用量,这意味着你只需为你消耗的 ingest 和 search 资源付费。由于更新、更快的硬件更高效,你的工作负载通常可以使用更少的资源完成任务,从而为大多数项目带来固有的成本降低。你可以在不支付额外价格的情况下获得性能提升------这就是优化效率的定义。

这对你开发者意味着什么?

此基础设施升级完全由 Elastic 管理,所以你无需动手 ------ 无需迁移,也无需配置更改。提升在所有基于 AWS 的 serverless 项目上都是即时且自动的。

这次升级让你能够:

  • 构建更快速的应用:专注于功能开发速度,同时知道你的底层搜索平台能提供用户所需的速度。

  • 自信创新:部署新的搜索、可观测性和安全功能------包括复杂的 AI 功能,如向量搜索和相关性排序------并确保平台在高峰期依然可以高性能处理负载。

  • 简化你的技术栈:使用完全托管的服务处理基础设施管理、容量规划和扩展,让你专注于代码和数据。

原文:https://www.elastic.co/search-labs/blog/elasticsearch-serverless-aws-performance-boost

相关推荐
精致先生1 小时前
ElasticSearch
elasticsearch·搜索引擎
坚持学习前端日记1 小时前
认证模块文档
java·服务器·前端·数据库·spring
想摆烂的不会研究的研究生1 小时前
并发场景——实时排行榜设计
数据库·redis·后端·缓存
huainian1 小时前
AWS INFR 可用性指标
云计算·aws
zhojiew1 小时前
Kafka Connect集成Apache Iceberg写入AWS Glue表
kafka·apache·aws
2501_9481953410 小时前
RN for OpenHarmony英雄联盟助手App实战:主导航实现
数据库
Filotimo_10 小时前
N+1查询问题
数据库·oracle
fenglllle11 小时前
spring-data-jpa saveall慢的原因
数据库·spring·hibernate
商业讯网112 小时前
国家电投海外项目运营经验丰富
大数据·人工智能·区块链