通过自动化测试减少系统的 Bug。对于一个稳定运行的系统,每次变更发布可能只改动极小的一部分,如果只测试这一小部分的功能,那么潜在的其他可能引起故障的连带变更就会被忽视,进而可能引发大问题。但是如果全部都回归测试一遍,投入的测试成本又非常高。自动化测试可以实现自动化回归,对于那些没有变更的功能,自动发现是否有引入的 Bug 或预期之外的变更。 通过自动化监控尽早发现系统的故障。监控系统是技术团队的眼睛,没有监控的系统犹如盲人在崎岖的山路狂奔。所以,一个成熟的高可用系统中必定包含着完整的监控系统,实时监控各种技术指标和业务指标的变化。如果系统出现故障,超过设定的阈值就会引发监控系统报警,或者启动自动化故障修复服务。 通过预发布验证发现测试环境无法发现的 Bug。系统在发布上线之前要经过各种测试,但是测试环境和线上运行环境还是会有很多不同。所以需要在线上集群中部署一台专门的预发布服务器,这台服务器访问的数据和资源完全是线上的,但是不会被用户访问到。开发人员发布代码的时候,先发布到这台预发布服务器,然后在这台服务器上做预发布验证,没有问题才会将代码发布到其他服务器上;如果有问题,也不会影响到用户访问,保证系统的高可用。 此外还可以通过灰度发布降低软件错误带来的影响。在一个大规模的应用集群中,每次只发布一小部分服务器,观察没有问题,再继续发布,保证即使程序有 Bug,产生的影响也控制在较小的范围内。
相关推荐
error_cn5 分钟前
unxz命令与版本控制集成Cache技术分享7 分钟前
124. Java 泛型 - 有界类型参数一头小阿牛7 分钟前
一个生产环境线程池问题解决与调优实践tony_cto7 分钟前
pandora-cloud集成 AJ-Captcha行为验证码自由的疯8 分钟前
实现 PC 端前后分离微信二维码扫码登录全攻略Victor3568 分钟前
MySQL(116)如何监控负载均衡状态?houseme9 分钟前
RustFS: 高性能分布式对象存储的优雅之选程序员小假11 分钟前
我们来说一说 Java 反序列化漏洞满分观察网友z12 分钟前
别再写成吨的 if-else 了!Java 反射:让你的代码学会“见招拆招”的魔法hai99long13 分钟前
MySQL 的BinLog日志