一、核心区别解析
|------|-----------------------|----------------|
| 维度 | CloudWatch | CloudTrail |
| 核心功能 | 资源性能监控(CPU / 内存 / 网络) | API 调用审计(操作溯源) |
| 数据类型 | 实时指标与日志 | 管理事件 + 数据事件日志 |
| 典型场景 | 自动伸缩触发 / 异常告警 | 合规审计 / 安全事件调查 |
技术贴士:CloudWatch 聚焦 "资源状态",CloudTrail 专注 "操作行为",两者如同云环境的 "健康检测仪" 与 "黑匣子"。

二、联动实战案例
场景:ECS 容器异常扩容溯源
- 异常检测CloudWatch 监测到 ECS 集群 CPU 持续 > 85%(配置自定义指标)
- 日志溯源CloudTrail 检索UpdateServiceAPI 调用记录,定位触发扩容的操作者
- 自动响应通过 EventBridge 触发 Lambda 函数,执行回滚操作
三、最佳实践建议
- 数据管道优化
将 CloudTrail 日志导入 CloudWatch Logs 实现统一分析 - 成本控制
- 设置 CloudTrail 只记录关键 API(如TerminateInstance)
- 启用 CloudWatch 指标数学表达式过滤噪声数据