阿里云 ECS 可观测性最佳实践

阿里云 ECS

阿里云 ECS(Elastic Compute Service)是阿里云提供的一种云计算服务,能够为用户提供安全、可靠的弹性计算能力。用户可以根据业务需求快速创建和配置虚拟服务器实例,灵活调整计算资源的规模,实现弹性伸缩。ECS 支持多种操作系统和镜像,具备高性能的计算、存储和网络能力,能够满足从简单网站托管到复杂企业级应用的各种需求。同时,阿里云 ECS 还提供丰富的安全功能、自动备份和快照功能,确保数据的安全性和可靠性,帮助用户高效地构建和管理云上应用环境。

观测云

观测云是一款专为 IT 工程师打造的全链路可观测产品,它集成了基础设施监控、应用程序性能监控和日志管理,为整个技术栈提供实时可观察性。这款产品能够帮助工程师全面了解端到端的用户体验追踪,了解应用内函数的每一次调用,以及全面监控云时代的基础设施。此外,观测云还具备快速发现系统安全风险的能力,为数字化时代提供安全保障。

观测云作为一款强大的全链路可观测性平台,能够为阿里云 ECS(Elastic Compute Service)提供全方位的监控解决方案。通过与阿里云 ECS 的无缝集成,观测云可以实时采集 ECS 实例的性能指标、日志数据和追踪信息,实现从基础设施到应用层面的全面监控。用户不仅能够直观地查看 CPU、内存、网络、磁盘等关键指标的实时状态和历史趋势,还可以通过观测云的智能告警功能及时发现并处理异常情况。此外,观测云支持将 ECS 数据与其他云服务或本地应用的监控数据进行关联分析,帮助用户从全局视角洞察系统运行状况,优化资源配置,提升运维效率,确保阿里云 ECS 环境的稳定运行和高效管理。

数据采集

  1. 登录观测云控制台
  2. 点击【集成】菜单,选择【云账号管理】
  3. 点击【添加云账号】,选择【阿里云】,填写界面所需的信息,如之前已配置过云账号信息,则忽略此步骤
  4. 点击【测试】,测试成功后点击【保存】,如果测试失败,请检查相关配置信息是否正确,并重新测试
  5. 点击【云账号管理】列表上可以看到已添加的云账号,点击相应的云账号,进入详情页
  6. 点击云账号详情页的【集成】按钮,在未安装列表下,找到阿里云 ECS,点击【安装】按钮,弹出安装界面安装即可。

关键指标

指标 描述 单位
load_1m 1分钟平均负载
load_5m 5分钟平均负载
load_15m 15分钟平均负载
cpu_wait CPU等待时间 %
cpu_user 用户态CPU使用率 %
cpu_system 系统态CPU使用率 %
memory_usedutilization 内存使用率 %
disk_readbytes 磁盘读取字节数 Bytes/s
disk_writebytes 磁盘写入字节数 Bytes/s
disk_readiops 磁盘读取IOPS IOPS
disk_writeiops 磁盘写入IOPS IOPS
fs_inodeutilization 文件系统inode使用率 %
IntranetInRate 内网入流量 Bytes/s
IntranetOutRate 内网出流量 Bytes/s
networkin_packages 入网数据包数 Packets/s
networkout_packages 出网数据包数 Packets/s
net_tcpconnection TCP连接数
VPC_PublicIP_InternetInRate VPC公网IP入流量 Bytes/s
VPC_PublicIP_InternetOutRate VPC公网IP出流量 Bytes/s
diskusage_total 磁盘总容量 Bytes
memory_totalspace 内总存容量 Bytes
memory_actualusedspace 实际使用内存 Bytes
cpu_cores CPU核心数
CPUUtilization CPU总使用率 %
VPC_PublicIP_InternetInRate_Percent VPC公网IP入流量占比 %
diskusage_free_Maximum 磁盘最大可用空间 Bytes
VPC_PublicIP_InternetOutRate_Percent VPC公网IP出流量占比 %

场景视图

登录观测云控制台,点击「场景」 -「新建仪表板」,输入 "阿里云 ECS", 选择 "阿里云 ECS",点击 "确定" 即可添加视图。

概览里面可以看到对象级别主机的信息

实例级别可以分析实例 内存、CPU、磁盘 IO、带宽等指标信息

监控器(告警)

观测云内置了监控器模板,可以选择从模版创建监控器,并开启适合业务的监控器以及时通知相关成员关注问题,触发条件、频率等信息可以依据实际业务进行调整。

登录观测云控制台,点击「监控」 -「新建监控器」,输入 "阿里云 ECS", 选择对应的监控器,点击 "确定" 即可添加。

总结

通过将阿里云 ECS 的原生监控数据集成到观测云平台,用户可以实现更全面、更高效的数据监控与分析。观测云作为一个强大的可观测性平台,能够将阿里云 ECS 的监控数据与自身丰富的数据处理和可视化能力相结合。用户不仅可以实时查看 ECS 的运行状态,如 CPU 使用率、内存占用、网络流量等关键指标,还可以通过观测云的智能告警功能,快速发现并响应潜在的性能问题或异常情况。此外,观测云支持多种数据源的整合,能够将 ECS 数据与其他云服务或本地应用的监控数据进行关联分析,帮助用户从全局视角洞察系统的健康状况,从而更好地优化资源配置、提升系统稳定性,并为后续的运维决策提供有力支持。

相关推荐
阿里云大数据AI技术8 小时前
全模态、多引擎、一体化,阿里云DLF3.0构建Data+AI驱动的智能湖仓平台
人工智能·阿里云·云计算
摇滚侠9 小时前
阿里云安装的 Redis 在什么位置,如何找到 Redis 的安装位置
redis·阿里云·云计算
m0_6948455713 小时前
tinylisp 是什么?超轻量 Lisp 解释器编译与运行教程
服务器·开发语言·云计算·github·lisp
ESBK202513 小时前
第四届移动互联网、云计算与信息安全国际会议(MICCIS 2026)二轮征稿启动,诚邀全球学者共赴学术盛宴
大数据·网络·物联网·网络安全·云计算·密码学·信息与通信
_运维那些事儿1 天前
VM环境的CI/CD
linux·运维·网络·阿里云·ci/cd·docker·云计算
人间打气筒(Ada)1 天前
k8s:CNI网络插件flannel与calico
linux·云原生·容器·kubernetes·云计算·k8s
主机哥哥1 天前
2026年阿里云五种方案快速部署 OpenClaw(Clawdbot)详细教程
阿里云·云计算
m0_694845571 天前
music-website 是什么?前后端分离音乐网站部署实战
linux·运维·服务器·云计算·github
新新学长搞科研1 天前
【智慧城市专题IEEE会议】第六届物联网与智慧城市国际学术会议(IoTSC 2026)
人工智能·分布式·科技·物联网·云计算·智慧城市·学术会议
翼龙云_cloud1 天前
亚马逊云代理商: RDS 误删实例急救指南 5 步找回数据
服务器·云计算·aws