通过自动化测试减少系统的 Bug。对于一个稳定运行的系统,每次变更发布可能只改动极小的一部分,如果只测试这一小部分的功能,那么潜在的其他可能引起故障的连带变更就会被忽视,进而可能引发大问题。但是如果全部都回归测试一遍,投入的测试成本又非常高。自动化测试可以实现自动化回归,对于那些没有变更的功能,自动发现是否有引入的 Bug 或预期之外的变更。 通过自动化监控尽早发现系统的故障。监控系统是技术团队的眼睛,没有监控的系统犹如盲人在崎岖的山路狂奔。所以,一个成熟的高可用系统中必定包含着完整的监控系统,实时监控各种技术指标和业务指标的变化。如果系统出现故障,超过设定的阈值就会引发监控系统报警,或者启动自动化故障修复服务。 通过预发布验证发现测试环境无法发现的 Bug。系统在发布上线之前要经过各种测试,但是测试环境和线上运行环境还是会有很多不同。所以需要在线上集群中部署一台专门的预发布服务器,这台服务器访问的数据和资源完全是线上的,但是不会被用户访问到。开发人员发布代码的时候,先发布到这台预发布服务器,然后在这台服务器上做预发布验证,没有问题才会将代码发布到其他服务器上;如果有问题,也不会影响到用户访问,保证系统的高可用。 此外还可以通过灰度发布降低软件错误带来的影响。在一个大规模的应用集群中,每次只发布一小部分服务器,观察没有问题,再继续发布,保证即使程序有 Bug,产生的影响也控制在较小的范围内。
相关推荐
南囝coding33 分钟前
现代Unix命令行工具革命:30个必备替代品完整指南夏之小星星44 分钟前
Springboot结合Vue实现分页功能唐僧洗头爱飘柔95271 小时前
【SpringCloud(8)】SpringCloud Stream消息驱动;Stream思想;生产者、消费者搭建韩立学长1 小时前
【开题答辩实录分享】以《自动售货机刷脸支付系统的设计与实现》为例进行答辩实录分享cj6341181502 小时前
DBeaver连接本地MySQL、创建数据库表的基础操作程序员爱钓鱼3 小时前
Python编程实战—面向对象与进阶语法 | 属性与方法程序员爱钓鱼3 小时前
Python编程实战——面向对象与进阶语法 | 构造函数与析构函数逻极3 小时前
Rust之结构体(Structs):构建自定义数据类型四念处茫茫3 小时前
Rust:复合类型(元组、数组)华仔啊3 小时前
为什么你的 @Transactional 不生效?一文搞懂 Spring 事务机制