阿里云 ECS 可观测性最佳实践

阿里云 ECS

阿里云 ECS(Elastic Compute Service)是阿里云提供的一种云计算服务,能够为用户提供安全、可靠的弹性计算能力。用户可以根据业务需求快速创建和配置虚拟服务器实例,灵活调整计算资源的规模,实现弹性伸缩。ECS 支持多种操作系统和镜像,具备高性能的计算、存储和网络能力,能够满足从简单网站托管到复杂企业级应用的各种需求。同时,阿里云 ECS 还提供丰富的安全功能、自动备份和快照功能,确保数据的安全性和可靠性,帮助用户高效地构建和管理云上应用环境。

观测云

观测云是一款专为 IT 工程师打造的全链路可观测产品,它集成了基础设施监控、应用程序性能监控和日志管理,为整个技术栈提供实时可观察性。这款产品能够帮助工程师全面了解端到端的用户体验追踪,了解应用内函数的每一次调用,以及全面监控云时代的基础设施。此外,观测云还具备快速发现系统安全风险的能力,为数字化时代提供安全保障。

观测云作为一款强大的全链路可观测性平台,能够为阿里云 ECS(Elastic Compute Service)提供全方位的监控解决方案。通过与阿里云 ECS 的无缝集成,观测云可以实时采集 ECS 实例的性能指标、日志数据和追踪信息,实现从基础设施到应用层面的全面监控。用户不仅能够直观地查看 CPU、内存、网络、磁盘等关键指标的实时状态和历史趋势,还可以通过观测云的智能告警功能及时发现并处理异常情况。此外,观测云支持将 ECS 数据与其他云服务或本地应用的监控数据进行关联分析,帮助用户从全局视角洞察系统运行状况,优化资源配置,提升运维效率,确保阿里云 ECS 环境的稳定运行和高效管理。

数据采集

  1. 登录观测云控制台
  2. 点击【集成】菜单,选择【云账号管理】
  3. 点击【添加云账号】,选择【阿里云】,填写界面所需的信息,如之前已配置过云账号信息,则忽略此步骤
  4. 点击【测试】,测试成功后点击【保存】,如果测试失败,请检查相关配置信息是否正确,并重新测试
  5. 点击【云账号管理】列表上可以看到已添加的云账号,点击相应的云账号,进入详情页
  6. 点击云账号详情页的【集成】按钮,在未安装列表下,找到阿里云 ECS,点击【安装】按钮,弹出安装界面安装即可。

关键指标

指标 描述 单位
load_1m 1分钟平均负载
load_5m 5分钟平均负载
load_15m 15分钟平均负载
cpu_wait CPU等待时间 %
cpu_user 用户态CPU使用率 %
cpu_system 系统态CPU使用率 %
memory_usedutilization 内存使用率 %
disk_readbytes 磁盘读取字节数 Bytes/s
disk_writebytes 磁盘写入字节数 Bytes/s
disk_readiops 磁盘读取IOPS IOPS
disk_writeiops 磁盘写入IOPS IOPS
fs_inodeutilization 文件系统inode使用率 %
IntranetInRate 内网入流量 Bytes/s
IntranetOutRate 内网出流量 Bytes/s
networkin_packages 入网数据包数 Packets/s
networkout_packages 出网数据包数 Packets/s
net_tcpconnection TCP连接数
VPC_PublicIP_InternetInRate VPC公网IP入流量 Bytes/s
VPC_PublicIP_InternetOutRate VPC公网IP出流量 Bytes/s
diskusage_total 磁盘总容量 Bytes
memory_totalspace 内总存容量 Bytes
memory_actualusedspace 实际使用内存 Bytes
cpu_cores CPU核心数
CPUUtilization CPU总使用率 %
VPC_PublicIP_InternetInRate_Percent VPC公网IP入流量占比 %
diskusage_free_Maximum 磁盘最大可用空间 Bytes
VPC_PublicIP_InternetOutRate_Percent VPC公网IP出流量占比 %

场景视图

登录观测云控制台,点击「场景」 -「新建仪表板」,输入 "阿里云 ECS", 选择 "阿里云 ECS",点击 "确定" 即可添加视图。

概览里面可以看到对象级别主机的信息

实例级别可以分析实例 内存、CPU、磁盘 IO、带宽等指标信息

监控器(告警)

观测云内置了监控器模板,可以选择从模版创建监控器,并开启适合业务的监控器以及时通知相关成员关注问题,触发条件、频率等信息可以依据实际业务进行调整。

登录观测云控制台,点击「监控」 -「新建监控器」,输入 "阿里云 ECS", 选择对应的监控器,点击 "确定" 即可添加。

总结

通过将阿里云 ECS 的原生监控数据集成到观测云平台,用户可以实现更全面、更高效的数据监控与分析。观测云作为一个强大的可观测性平台,能够将阿里云 ECS 的监控数据与自身丰富的数据处理和可视化能力相结合。用户不仅可以实时查看 ECS 的运行状态,如 CPU 使用率、内存占用、网络流量等关键指标,还可以通过观测云的智能告警功能,快速发现并响应潜在的性能问题或异常情况。此外,观测云支持多种数据源的整合,能够将 ECS 数据与其他云服务或本地应用的监控数据进行关联分析,帮助用户从全局视角洞察系统的健康状况,从而更好地优化资源配置、提升系统稳定性,并为后续的运维决策提供有力支持。

相关推荐
你的大佬99910 小时前
阿里云百炼ai模型
人工智能·阿里云·云计算
一只栖枝11 小时前
备考华为HCIA - 云计算,培训与自学到底该怎么选?
云计算·华为认证·hcia·考证·职业规划
数据与人工智能律师17 小时前
AI的法治迷宫:技术层、模型层、应用层的法律痛点
大数据·网络·人工智能·云计算·区块链
荣光波比1 天前
Docker(三)—— Docker Compose 编排与 Harbor 私有仓库实战指南
运维·docker·容器·云计算
企鹅侠客1 天前
mysqldump导入备份数据到阿里云RDS会报错吗
阿里云·adb·云计算
iHero1 天前
【Jitsi Meet】阿里云Docker安装Jitsi Meet后的调整
阿里云·docker·云计算
荣光波比1 天前
Ansible(三)—— 使用Ansible自动化部署LNMP环境实战指南
运维·自动化·云计算·ansible
荣光波比1 天前
Docker(五)—— Docker Compose 一键搭建 LNMP 架构并部署 WordPress
运维·docker·容器·云计算
mjhcsp2 天前
深入解析 IDM 插件开发挑战赛:技术要点与实践指南
服务器·阿里云·云计算
荣光波比2 天前
MySQL数据库(八)—— MySQL全量+增量备份方案:从脚本开发到连锁餐饮场景落地
运维·数据库·mysql·云计算