通过自动化测试减少系统的 Bug。对于一个稳定运行的系统,每次变更发布可能只改动极小的一部分,如果只测试这一小部分的功能,那么潜在的其他可能引起故障的连带变更就会被忽视,进而可能引发大问题。但是如果全部都回归测试一遍,投入的测试成本又非常高。自动化测试可以实现自动化回归,对于那些没有变更的功能,自动发现是否有引入的 Bug 或预期之外的变更。 通过自动化监控尽早发现系统的故障。监控系统是技术团队的眼睛,没有监控的系统犹如盲人在崎岖的山路狂奔。所以,一个成熟的高可用系统中必定包含着完整的监控系统,实时监控各种技术指标和业务指标的变化。如果系统出现故障,超过设定的阈值就会引发监控系统报警,或者启动自动化故障修复服务。 通过预发布验证发现测试环境无法发现的 Bug。系统在发布上线之前要经过各种测试,但是测试环境和线上运行环境还是会有很多不同。所以需要在线上集群中部署一台专门的预发布服务器,这台服务器访问的数据和资源完全是线上的,但是不会被用户访问到。开发人员发布代码的时候,先发布到这台预发布服务器,然后在这台服务器上做预发布验证,没有问题才会将代码发布到其他服务器上;如果有问题,也不会影响到用户访问,保证系统的高可用。 此外还可以通过灰度发布降低软件错误带来的影响。在一个大规模的应用集群中,每次只发布一小部分服务器,观察没有问题,再继续发布,保证即使程序有 Bug,产生的影响也控制在较小的范围内。
相关推荐
冰_河2 小时前
QPS从300到3100:我靠一行代码让接口性能暴涨10倍,系统性能原地起飞!!JavaGuide4 小时前
7 道 RAG 基础概念知识点/面试题总结桦说编程4 小时前
从 ForkJoinPool 的 Compensate 看并发框架的线程补偿思想格砸5 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化蝎子莱莱爱打怪6 小时前
GitLab CI/CD + Docker Registry + K8s 部署完整实战指南哈密瓜的眉毛美6 小时前
零基础学Java|第三篇:DOS 命令、转义字符、注释与代码规范用户60572374873087 小时前
AI 编码助手的规范驱动开发 - OpenSpec 初探哈密瓜的眉毛美7 小时前
零基础学Java|第二篇:Java 核心机制与第一个程序:从 JVM 到 Hello World用户8307196840827 小时前
RabbitMQ vs RocketMQ 事务大对决:一个在“裸奔”,一个在“开挂”?