AutoOps 使每个 Elasticsearch 部署都更易于管理

作者:来自 Elastic Ziv SegalOri Shafir

AutoOps for Elasticsearch 通过性能建议、资源利用率和成本洞察、实时问题检测和解决路径显著简化了集群管理。

什么是 AutoOps?

虽然 Elasticsearch 是一款功能强大且可扩展的搜索引擎,可提供多种功能,但由于其有时复杂的管理和管理体验,许多用户发现它具有挑战性。我们听到了你的声音,我们很高兴与你分享一些重大新闻!Opster 团队一直在努力使 AutoOps 变得更好,并使其成为 Elastic 平台的无缝组成部分。AutoOps 可在部分 Elastic Cloud 区域使用,并且覆盖范围正在迅速扩大!

AutoOps 使 Elastic Cloud 易于操作

AutoOps for Elasticsearch 通过性能建议、资源利用率和成本洞察、实时问题检测和解决路径显著简化了集群管理。借助 AutoOps,你将能够:

  • 通过针对你的 Elasticsearch 使用率和配置量身定制的洞察,最大限度地减少管理时间
  • 使用预配置的警报实时分析数百个 Elasticsearch 指标,以在问题变得严重之前检测和标记问题
  • 通过深入到问题发生的时间点来获取根本原因分析,并提供包括上下文 Elasticsearch 命令在内的解决方案建议
  • 通过提供优化建议来提高资源利用率

在下面的每个场景中,让我们看看用户可能遇到的问题示例,以及 AutoOps 洞察(屏幕截图)如何立即提供帮助!

真实场景:AutoOps 如何让 Elasticsearch 操作更简单

以下场景提供了真实问题,以及 AutoOps 如何提供根本原因分析,深入到问题发生的时间点,并提出解决问题的建议。

场景 #1:查找导致严重搜索延迟的查询

问题

用户抱怨他们的仪表板很慢,需要很长时间才能加载......

AutoOps 洞察

AutoOps 报告 "Long running search task - 长时间运行的搜索任务"事 件,识别出运行了 4 分钟的搜索,其中包含 4 个嵌套聚合,并建议优化导致延迟的查询的方法。

解决方案:

AutoOps 提供了一个 cURL 命令来取消查询。通过识别和取消长时间运行的搜索任务,管理员能够阻止此特定查询。

AutoOps 监控任务管理 API 并标记长时间运行的搜索任务,从而提供一种简单的方法来检测长时间运行的搜索查询并对其进行优化。

AutoOps 提供上下文 Elasticsearch 命令来解决问题,例如取消长时间运行的搜索任务。

场景 #2:数据分层使用不力,导致搜索和索引速度缓慢

问题

用户报告搜索性能和索引速度缓慢。

AutoOps 洞察

AutoOps 检测到由于热节点上的索引活动导致负载增加而产生的多个问题,导致其中一个节点上的索引队列较高且搜索速度缓慢。

AutoOps 检测到索引活动发生在热节点中,索引队列较高,并且在其中一个热节点上检测到搜索速度缓慢。

解决方案

团队更新了 ILM 策略,以确保仅在没有进一步的索引活动时索引才移出热层。团队更新了 ILM 策略,以确保仅在没有进一步的索引活动时索引才移出热层。

AutoOps 检测到索引发生在热层:

AutoOps 检测到索引队列很高,并提供解决建议列表:

AutoOps 慢速搜索性能事件 - 检测加载节点上的慢速搜索性能。

场景 #3:调查生产停机时间

问题

报告了一次中断,集群上的 CPU 使用率暂时很高

AutoOps 洞察

AutoOps 确定了 CPU 利用率较高的时间窗口,并深入分析了问题发生的时间点,并建议检查慢日志。进一步深入节点视图会发现,每天早上 7 点左右 CPU 的使用率都很高。

解决方案

SRE 找到一个计划在每天早上 7 点运行的脚本,通过修改脚本,他们能够修复问题并稳定集群。

AutoOps 提供超链接,可快速深入了解检测到的问题:

深入分析屏幕提供有关节点、索引、分片和模板优化的额外背景信息。

场景 #4:客户 Kibana 仪表板速度很慢

问题:

客户抱怨 Kibana 仪表板有时比平时慢

AutoOps 洞察

AutoOps 检测到可能导致搜索性能变慢的大型分片,并建议将其重新编入较小的索引并查看 ILM 策略。

解决方案

团队遵循 AutoOps 的建议更改分片大小,从而提高仪表板的响应能力和集群稳定性。

AutoOps 监控分片大小并提醒何时以及如何优化分片。

AutoOps 与 Elastic:更具标志性的组合!

通过分析数百个 Elasticsearch 指标、你的配置和使用模式,AutoOps 会推荐运营和监控见解,从而真正节省管理时间和硬件成本。

Elasticsearch 性能优化:AutoOps 会告诉你如何让你的 Elasticsearch 集群平稳运行。它根据你的特定使用情况和配置提供量身定制的见解,帮助你保持高性能。

针对 Elasticsearch 特定问题的实时问题检测:AutoOps 会持续分析数百个 Elasticsearch 指标并提供预配置的警报,以捕获诸如提取瓶颈、数据结构配置错误、负载不平衡、查询缓慢等问题 - 以免它们变成更大的问题。

轻松故障排除:故障排除可能很复杂,尤其是在较大的环境中。AutoOps 执行根本原因分析并提供问题发生时的确切时间点的深入分析,以及包括上下文 Elasticsearch 命令和最佳实践在内的解决路径。

Elasticsearch 部署的成本可见性和优化:AutoOps 可识别未充分利用的节点、小型或大型索引和分片,并建议数据层优化。这有助于提高资源利用率并节省硬件成本。

无缝集成:AutoOps 不仅仅是一个独立的工具;它内置于 Elastic Cloud 中,并与警报和消息传递框架(MS Teams 和 Slack)、事件管理系统(PagerDuty 和 OpsGenie)和其他工具集成。你可以根据自己的用例自定义 AutoOps 警报和通知。

查询优化、模板优化等等!AutoOps 内置了我们在运行和管理多种类型的 Elastic 环境方面的专业知识。AutoOps 可识别并提醒你有关昂贵的查询、存在的数据类型以及是否/何时应该(或不应该)使用它们,例如将数字存储为整数/长整型,以便针对范围查询进行优化。还有许多其他类型的内置建议,我们希望你会觉得有用!

AutoOps 什么时候可以供我使用?

我们正在分阶段推出 AutoOps,首先从部分 Elastic Cloud Hosted 区域开始,覆盖范围正在迅速扩大。接下来,我们将专注于 Elastic Cloud Serverless 用户。虽然 Elastic Cloud Serverless 已经让 Elasticsearch 更易于使用,但 AutoOps 将通过提供高级监控和优化功能将其提升到一个新的水平。对于我们的自我管理客户,我们并没有忘记你。我们正在制定计划,将 AutoOps 带给你!

试用 AutoOps:操作 Elasticsearch 的简便方法

Elasticsearch 功能强大,但也应尽可能简单高效。借助 AutoOps,我们正在大力兑现这一承诺。无论你是在追求最佳性能还是希望削减成本,AutoOps 都能提供见解和工具来帮助你。

有疑问或渴望深入了解 AutoOps?以下是一些入门方法,祝你优化愉快!

准备好亲自尝试了吗?开始免费试用。

想要获得 Elastic 认证?了解下一期 Elasticsearch 工程师培训何时开始!

相关推荐
IT古董42 分钟前
【漫话机器学习系列】017.大O算法(Big-O Notation)
人工智能·机器学习
凯哥是个大帅比42 分钟前
人工智能ACA(五)--深度学习基础
人工智能·深度学习
小小工匠1 小时前
ElasticSearch - 深入解析 Elasticsearch Composite Aggregation 的分页与去重机制
elasticsearch·composite·after_key·桶聚合分页
风_流沙1 小时前
java 对ElasticSearch数据库操作封装工具类(对你是否适用嘞)
java·数据库·elasticsearch
m0_748232921 小时前
DALL-M:基于大语言模型的上下文感知临床数据增强方法 ,补充
人工智能·语言模型·自然语言处理
szxinmai主板定制专家1 小时前
【国产NI替代】基于FPGA的32通道(24bits)高精度终端采集核心板卡
大数据·人工智能·fpga开发
海棠AI实验室1 小时前
AI的进阶之路:从机器学习到深度学习的演变(三)
人工智能·深度学习·机器学习
机器懒得学习1 小时前
基于YOLOv5的智能水域监测系统:从目标检测到自动报告生成
人工智能·yolo·目标检测
QQ同步助手2 小时前
如何正确使用人工智能:开启智慧学习与创新之旅
人工智能·学习·百度