开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, Oceanbase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,(共2150人左右 1 + 2 + 3 + 4 +5) 新人奖直接分配到5群,另欢迎 OpenGauss 的技术人员加入。
腾讯云最近出现故障,深表遗憾,实际上上次的我们作为阿里云的大客户,也是有影响的,不过话说回来,没有特别的大,有影响。
最近相关的文章也较多报道到底怎么回事,中间的过程是什么,但后面的事情就少有人说了,作为一个纯种的甲方的数据库的负责的PEOPLE,我只能说,影响才刚刚开始,这就和核爆炸一样,一开始周围的人还都刚看到光,还没有声音,等声音到了,冲击波还没到,等冲击波到了,辐射还没到,等辐射到了,你还感觉活蹦乱跳,没事。
然后你就死了。
最近的云不稳定的问题,给很多的企业主造成了困扰,都不想自建机房,自己拥有设备,同时也不想拥有更多的运维工作者,DBA等,在云厂商和一些 CTO 的省钱理论下,云逐渐称为现在,未来IT的主流基础设施。
但基础设施,你的拿出基础设施的态度和能力,故障不是不可以接受,但莫名其妙的故障并且是致命的,长时间的,影响范围很大的,这就接受不了,如同自来水公司,来一个全国大停水这谁也受不了,尤其是工业用水,有些工厂工业用水停止了,那么机械设备就报废了,或者产生很大的经济风险和损失。
到了云这里,产生的经济损失可能更大,很多中小企业,大型企业一部分的身价性命都是在云上的,云停止了那么公司也就破产和倒闭了。我可以列举出很多知名的企业,都在用云,去实体设备名单。
在一片云向好的大环境下,国内举足轻重的两大云厂商的工作"失误",给一些CTO 和 云倡导者们当头一棒 ,云稳定的99.999 的神话是否还能继续,这就变成一个"迷雾"一样的事情。如同核爆炸,后续的影响还未到,但这里需要说一说,后续可能会导致的一些 基于云 和 IT 基础建设方面的问题。
当前从实体机,实体机房迁移就是为了要云服务厂商的99.999的承诺,但大家并为注意到,如果不符合这个承诺后的,赔偿问题和如何完成99.999SLA 的方式。说句实话3年多的全云工作,我对这块还是一个空白。之前小云也用过,出问题也是平常,最后都是道歉或者延迟使用云的时间作为赔偿。
所以这里使用云的企业,应该注意出现问题,以及赔偿的方式和实际赔偿的案例是否有,作为一般企业是否有能力,和云厂商进行PK ,尤其你的身家性命都在云厂商手里的时候,你有能力拿起法律的武器和他们战斗。
同时一部分CTO 或者架构师已经提出了新的云玩法,脚踩几只船的方案,当然这些方案里面有实体的部分,也就是数据有一部分需要同步到线下云下的方式来满足出现问题的应急处理。
同时一些公司也应该准备,面对一些企业的特殊需求关于,云在不稳定时的切换方案的提供和相关方案的部署。这也是一些,高级企业需要在中国两大云企业分分出现严重问题后的,企业安全强需求。
另外产生的其他影响还有,一些大型企业可能准备在上云,或者有计划上云,其中有一些"老顽固" 对于上云保留意见,而阿里云和腾讯云的大面积故障的问题,正好给这些人口实,这些企业上云的计划会,再次耽搁或直接作废。
另外一些已经上云的企业,如果得不到更好的服务或者承诺或者实际影响到企业的运营,也有可能会产生下云的计划等,或者采用混合云的方案来进行IT 整体的运营。这些都是我们不希望看到的,或者与"时代方向相悖"的工作进程。
此时可能会有声音提示,不是还有 AWS 和 微软aurze 吗,他们是不是更稳定。我们可以见下图,在看完下面的图后,这二位也是故障也是有的并且频次也不是很低。
写到这里,那么核爆炸的影响在哪里,这是一个深层次的,时间延续很久的影响,更多的IT 基础设施,可能不会在以单一云作为基础,多云模式,线上,线下合作的模式,备份的模式,或者数据同步的模式都会被提出和在关键的位置上被使用。
同时各大企业的IT 负责人和公司的法律部门也应该,学习和消化云故障带来损失后的理赔机制和法律诉讼的知识的涉及。当然基于这些问题,IT 上云后被裁员也可能被影响,终究企业还是希望自己拥有更多的主动权,有一个专业的IT 的团队,在出现问题,或出现问题前给你进行相关的出谋划策和预防是一个企业IT 建设是否完整的 "标杆"。
云故障对于企业IT 打工人,并不算一个坏消息,或许从心底,故障多一点也未必 在某个层面不是一件"好事"。