OpenSREClaw 是什么
一句话,他是 SRE 使用的 OpenClaw,是 AIOps 落地的具体产品。
OpenSREClaw 的定位
OpenSREClaw 的定位是三个方向:
1)作为工具完成巡检、变更值守等工作,同时对数据波动进行风险评估,给出规避建议;监听风险事件、影响范围感知、实时风险等级评估。
2)作为技术风险专家参与变更方案评审、故障恢复预案推荐、故障复盘报告生成,基于历史故障沉淀,输出评审意见、恢复建议、复盘报告。
3)辅助 SRE 架构师,设计基于混沌工程的攻防演练方案,通过主动探测系统韧性脆弱项,给出体系化的风险纵深防御体系升级行动方案。
OpenSREClaw 的优势
1)不只是固定逻辑的工具,能够从历史数据中发现模式、规律,给出针对性的建议
2)不带有人性中的避责意,能够给出客观公正的故障复盘根因,避免复盘动作变形
3)多 Agent 机制可以以左右互搏的机制,实现 7*24 不间断持续进化,远超人类
多 Agent 规划
根据 SRE 的工作职责和 Agent 单一职责原则,规划 Agent 和 Skill 如下:
- Main,Copilot Agent,人机交互入口、多 Agent 协调
- Monitor,查询指标数据,阈值和波动风险评估、输出报告
- Change,变更风险控制,审批、值守、验证、回滚
- Incident,事件响应、应急进展同步、应急预案推送、故障复盘
- Capacity,容量规划和治理,容量预警,成本优化建议
- Chaos, 混沌工程演练,提供韧性脆弱项评估和风险防控建议