使用 Datadog 和 Slack Alerts 监控 AWS EC2

监控是大多数 IT 专业人员的关键职责之一。如果您最近正在寻找新工作,您可能已经注意到"监控"一词几乎出现在许多组织发布的每份职位描述中。

您可以找到各种监控工具,它们提供一些卓越的功能来简化您的工程工作。然而,Datadog 是大多数组织愿意用来监控其应用程序和基础设施的热门监控工具之一。

因此,我决定指导您使用 Datadog 监控AWS EC2,并将重要警报转发到 Slack 频道。您需要一些其他工具来尝试此解决方案,但我将在下面列出执行此任务所需的所有工具。别担心!您可以使用它们的免费计划!

  • 本地或云虚拟机
  • Datadog
  • Slack
  • GitHub

本文不会向您展示如何分别设置每个工具,因为您可以找到许多文章来指导您完成此过程。我们专注于将所有这些工具集成在一起,以构建一个简单的监控解决方案。

在EC2 中安装 Datadog

首先,创建一个免费的 Datadog 帐户(选择"免费试用")。您可能需要按照几个步骤设置帐户。之后,您需要一台虚拟机。该虚拟机可以是本地虚拟机,也可以是云端虚拟机。

我有一个AWS EC2虚拟机。让我们在 EC2中安装 Datadog。

现在,我们需要从 Datadog 门户创建一个 API 密钥。您必须在以后的配置中使用此密钥。在 Datadog 仪表板上点击您的个人资料图片,然后在"组织设置"下选择"API 密钥"。

通过SSH工具连接到EC2主机,然后运行下面的命令:

复制代码
DD_API_KEY=f099de0d141c845688c4078aae87ee3 DD_SITE="ap1.datadoghq.com" bash -c "$(curl -L https://install.datadoghq.com/scripts/install_script_agent7.sh)"

要验证安装是否成功,请转到 Datadog 门户并搜索"host"。如果您正确遵循安装步骤,您将在 Datadog 的host视图中看到AWS EC2。

配置slack

安装免费版的slack,配置slack 工作区:zhengmao_devops

然后创建channel, datadog-alert,用来接收datadog 的告警。

配置datadog 告警规则

一个常见的系统监控指标是给定系统或主机上的可用磁盘空间。本指南将帮助您创建一个监控器,当任何向 Datadog 报告的主机的可用磁盘空间低于 40% 时,它会向您发出警报。

  1. 要创建可用磁盘空间监视器:
  2. 在导航菜单中,点击"监视器"。
  3. 点击"新建监视器"。
  4. 选择"指标"作为监视器类型。
  5. 在"定义指标"部分,使用"system.disk.free"作为指标,并选择"平均值"作为主机。这是查询 a。
  6. 点击"添加查询"。对于此指标,使用"system.disk.total"作为指标,并选择"平均值"作为主机。这是查询 b。
  7. 在出现的公式中,将"a + b"替换为"a/b*100"。

配置datadog 通知和slack 集成

输入前面创建的slack channel,然后输入subject

点击测试通知,然后在slack中可以看到这个告警:

Datadog 是一款实用的云监控平台,它提供统一的解决方案,无缝整合可观察性的三大支柱,并实现整个应用程序堆栈的全面可见性。除此之外,最重要的是其流畅无阻的集成流程,拥有超过 400 个内置集成和预定义的仪表板模板。Datadog 内部有多种产品,支持我们应用程序各层的不同用例,并为组织内的不同团队提供统一的管理平台。

关于缺点,所有这些功能都需要付费。Datadog 的定价约为每位用户每月 15 美元,企业版为 23 美元。Datadog 的定价政策公开,价格通常较低。它的月度定价选项包括按主机、按百万事件和按分析日志文件 GB 计算。

总而言之,这完全取决于您想要实现的用例.

结论

基础设施监控是现代应用程序获得整个堆栈全面可见性的必备属性。可观察性的三大支柱,即监控、警报和修复,通常需要相互关联才能获得最大效益。因此,选择一个具有统一视图、整合所有三大可观察性支柱的监控平台,可以随时应对不可预见的情况。

相关推荐
DolitD1 小时前
云流技术深度剖析:国内云渲染主流技术与开源和海外厂商技术实测对比
功能测试·云原生·开源·云计算·实时云渲染
翼龙云_cloud1 小时前
阿里云渠道商:阿里云 ECS 从安全组到云防火墙的实战防护指南
安全·阿里云·云计算
YongCheng_Liang1 小时前
从零开始学虚拟化:桌面虚拟化(VDI)入门指南(架构 + 产品 + 部署)
运维·云计算
万物得其道者成2 小时前
阿里云 H5 一键登录接入实战:前后端完整实现
阿里云·云计算·状态模式
翼龙云_cloud16 小时前
国际云代理商:2026年国际云注册风控升级实战指南 8 大平台无卡解决方案对比
服务器·阿里云·云计算
阿里云大数据AI技术19 小时前
全模态、多引擎、一体化,阿里云DLF3.0构建Data+AI驱动的智能湖仓平台
人工智能·阿里云·云计算
摇滚侠20 小时前
阿里云安装的 Redis 在什么位置,如何找到 Redis 的安装位置
redis·阿里云·云计算
m0_694845571 天前
tinylisp 是什么?超轻量 Lisp 解释器编译与运行教程
服务器·开发语言·云计算·github·lisp
ESBK20251 天前
第四届移动互联网、云计算与信息安全国际会议(MICCIS 2026)二轮征稿启动,诚邀全球学者共赴学术盛宴
大数据·网络·物联网·网络安全·云计算·密码学·信息与通信
fendouweiqian1 天前
AWS WAF(配合 CloudFront)基础防护配置:免费能做什么、要不要开日志、如何限制危险方法
网络安全·aws·cloudfront