AWS RDS创建ReadLatency,WriteLatency,DBLoad,AuroraVolumeBytesLeftTotal四种指标告警

ReadLatency:连续3个5分钟读延迟20ms告警

bash 复制代码
# Alert when read latency exceeds 20ms
aws cloudwatch put-metric-alarm \
  --alarm-name "rds-mydb-read-latency-high" \
  --alarm-description "RDS read latency above 20ms" \
  --metric-name ReadLatency \
  --namespace AWS/RDS \
  --statistic Average \
  --period 300 \
  --evaluation-periods 3 \
  --threshold 0.02 \
  --comparison-operator GreaterThanThreshold \
  --dimensions Name=DBInstanceIdentifier,Value=my-database \
  --alarm-actions arn:aws:sns:us-east-1:1242436:rds-critical-alerts

WriteLatency:连续3个5分钟写延迟20ms告警

bash 复制代码
# Alert when write latency exceeds 20ms
aws cloudwatch put-metric-alarm \
  --alarm-name "rds-mydb-write-latency-high" \
  --alarm-description "RDS write latency above 20ms" \
  --metric-name WriteLatency \
  --namespace AWS/RDS \
  --statistic Average \
  --period 300 \
  --evaluation-periods 3 \
  --threshold 0.02 \
  --comparison-operator GreaterThanThreshold \
  --dimensions Name=DBInstanceIdentifier,Value=my-database \
  --alarm-actions arn:aws:sns:us-east-1:1231423523:rds-critical-alerts

DBLoad:连续3个5分钟CPU平均负载超80%告警

bash 复制代码
aws cloudwatch put-metric-alarm \
    --alarm-name "aurora-dbload-writer-high" \
    --alarm-description "DBLoad 超过 1.6 (vCPU 80%)" \
    --metric-name "DBLoad" \
    --namespace "AWS/RDS" \
    --statistic "Average" \
    --period 300 \
    --evaluation-periods 3 \
    --threshold 1.6 \
    --comparison-operator "GreaterThanThreshold" \
    --dimensions Name=DBInstanceIdentifier,Value=你的Writer实例ID

这个1.6是怎么来的。我的AWS数据库实例是db.r5.large类型,这个类型只有2个vCPU,所以2*0.8=1.6,意思CPU平均负载超80%。

AuroraVolumeBytesLeftTotal:剩余磁盘空间不足50GB告警

bash 复制代码
aws cloudwatch put-metric-alarm \
  --alarm-name "Aurora-Storage-Left-Critical-30GB" \
  --alarm-description "Aurora 剩余存储低于 50GB,紧急!" \
  --metric-name AuroraVolumeBytesLeftTotal \
  --namespace AWS/RDS \
  --statistic Average \
  --period 300 \
  --evaluation-periods 3 \
  --threshold 53687091200 \
  --comparison-operator LessThanOrEqualToThreshold \
  --dimensions Name=DBClusterIdentifier,Value=你的集群名 \
  --alarm-actions arn:aws:sns:us-west-2:123456789012:MyAlarmTopic \
  --ok-actions arn:aws:sns:us-west-2:123456789012:MyAlarmTopic \
  --treat-missing-data notBreaching

参考:

相关推荐
唐青枫2 天前
MySQL JSON 实战详解:从存储、查询、更新到 JSON_TABLE 与索引
sql·mysql
小满8782 天前
5.Mysql事务隔离级别与锁机制
mysql
元Y亨H3 天前
技术笔记:MySQL 字符集排序规则与大小写敏感性问题解决方案
mysql
这个DBA有点耶4 天前
GROUP BY优化全解:如何写出既不丢数据又飞快的分组查询
数据库·mysql·架构
掉头发的王富贵4 天前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
SamDeepThinking4 天前
一条UPDATE语句在MySQL 8.0中到底加了几把锁?
后端·mysql·程序员
李白客6 天前
KES新版MySQL兼容能力再升级意味着什么?
mysql·国产数据库
Jim6008 天前
【吃透 MySQL InnoDB连载】第 1 章・解密线上数据库高频故障
mysql
GreatSQL8 天前
gt-checksum v4.0.0 新功能解读系列文章(4):SSL 加密连接——数据校验传输安全再升级
mysql