部署自动化的重要性之骑士资本案例研读

骑士资本(Knight Capital)是一家证券交易所的金融服务公司,也是美国市场上最大的交易商之一。其在纽约证券交易所的市场份额为 17.3%,在纳斯达克的市场份额为 16.9%。

该公司有一项零售流动性计划,打算用新的 RLP 代码替换旧的 SMARS 代码。他们的策略是重新利用一个用于开启和关闭代码运行的标记。旧代码是一个留在服务器上的 "动力管道挂钩"(power pipe peg)。他们计划先升级代码,切换标记,然后开始运行新代码。那么,这过程中会出什么岔子呢?

2012 年 8 月 1 日,他们手动升级了八台服务器中的七台。一名系统管理员完成了其中七台的升级,却忘了升级第八台服务器。他们进入测试模式,在切换开关时还以为自己是在测试服务器。然而,第八台服务器却在真实网络上进行了真实交易,导致 6.4 亿美元的损失。

这一事件严重扰乱了纽约证券交易所上市的 148 家公司的股价。收到的主订单被处理,有缺陷的 "动力管道挂钩" 发出了数百万条子订单,在大约 45 分钟内促成了 154 只股票、超过 3.97 亿股的 400 万笔交易。第二天,骑士资本就破产倒闭了,原因就是有人没升级那第八台服务器。旧代码运行起来,进行了本不该有的交易。

他们原本可以采取什么不同做法来避免这类错误呢?

这个案例很好地说明了,采用持续交付(Continuous Delivery)实现部署自动化,原本可以避免出现某一台服务器配置与其他服务器不同的情况。没有自动化,每次部署都可能出现人为失误,还可能导致应用程序出现故障。针对测试环境、预发布环境和生产模拟环境进行自动化部署和测试,原本可以确保此次代码变更不会引发这场灾难。

相关推荐
IT成长日记3 小时前
【Docker基础】Docker数据持久化与卷(Volume)介绍
运维·docker·容器·数据持久化·volume·
物联网老王5 小时前
Ubuntu Linux Cursor 安装与使用一
linux·运维·ubuntu
艾伦_耶格宇6 小时前
【ACP】阿里云云计算高级运维工程师--ACP
运维·阿里云·云计算
一位摩羯座DBA7 小时前
Redhat&Centos挂载镜像
linux·运维·centos
cui_win8 小时前
【网络】Linux 内核优化实战 - net.core.flow_limit_table_len
linux·运维·网络
风清再凯8 小时前
自动化工具ansible,以及playbook剧本
运维·自动化·ansible
深圳安锐科技有限公司8 小时前
深圳安锐科技发布国内首款4G 索力仪!让斜拉桥索力自动化监测更精准高效
运维·安全·自动化·自动化监测·人工监测·桥梁监测·索力监测
猫头虎8 小时前
猫头虎 AI工具分享:一个网页抓取、结构化数据提取、网页爬取、浏览器自动化操作工具:Hyperbrowser MCP
运维·人工智能·gpt·开源·自动化·文心一言·ai编程
SKYDROID云卓小助手9 小时前
无人设备遥控器之自动调整编码技术篇
人工智能·嵌入式硬件·算法·自动化·信号处理
cocologin10 小时前
RIP 技术深度解析
运维·网络·网络协议