阿里云全球故障凸显“云集中”风险

阿里云12日发生的全球性故障再次将"云集中风险"推上风口浪尖。这一公有云史上罕见的事件不仅影响了数以万计的企业和服务,也引发了对云服务集中化趋势的深刻反思。

2023年11月12日17:44(GMT+8)开始,阿里云基础设施发生严重故障,导致阿里巴巴大量产品无法连接,"阿里云盘崩了""淘宝又崩了""闲鱼崩了""钉钉崩了" 等话题相继登上热搜,阿里系诸多产品受到影响。

故障期间阿里云控制台无法正常登录,API调用异常,导致阿里云全系列产品服务及全球区域(包括阿里云位于中国内地、港澳台、亚洲其他地区、欧洲、北美、中东、政务云以及金融云等)数据中心均受影响。

故障恢复期间,一些用户抱怨由于DNS服务也出现问题,导致无法做故障转移,"想跑都跑不了"。

根据阿里云发布的通知,故障持续了3个多小时后才基本完全恢复:

  • **17:50------**阿里云确认故障原因与某个底层服务组件有关,工程师正在紧急处理中。

  • **18:54------**经过工程师处理,杭州、北京等地域控制台及API服务已恢复,其他地域控制台服务逐步恢复中。

  • **19:20------**工程师通过分批重启组件服务,绝大部分地域控制台及API服务已恢复。

  • **19:43------**异常管控服务组件均已完成重启,除个别云产品(如消息队列MQ、消息服务MNS)仍需处理,其余云产品控制台及API服务已恢复。

  • **20:12------**北京、杭州等地域消息队列MQ已完成重启,其余地域逐步恢复中。

  • **21:11------**受影响云产品均已恢复,因故障影响部分云产品的数据(如监控、账单等)可能存在延迟推送情况,不影响业务运行。

阿里云此次全球性故障的严重程度、影响规模和范围在公有云历史上都极为罕见,严重打击了各行业用户对公有云可靠性和安全性的信心,进一步凸显了Gartner三季度风险报告中强调的"云集中"风险。

相关推荐
Cat_Rocky几秒前
ingress service配置解析
linux·服务器·网络
小冷爱学习!几秒前
Apache Shiro 1.2.4 反序列化漏洞Shiro-550(CVE-2016-4437)
服务器·网络·python·安全·网络安全·apache
计算机安禾3 分钟前
【计算机网络】第27篇:高并发服务端的网络架构设计——从Reactor模式到协程调度
网络·计算机网络
跨境小彭7 分钟前
Temu 批量下架工具推荐|合规安全,支持 SPU/ID 批量导入
大数据·人工智能·安全·跨境电商·temu
计算机安禾8 分钟前
【计算机网络】第23篇:Wireshark抓包分析的方法论——过滤表达式、跟踪流与统计工具
网络·计算机网络·wireshark
IpdataCloud19 分钟前
在线教育视频卡顿?如何用IP离线库实现学生就近内容加速?
运维·服务器·网络
南村群童欺我老无力.19 分钟前
鸿蒙PC链接数据库操作的并发与事务安全
数据库·安全·华为·harmonyos
一拳一个娘娘腔22 分钟前
渗透测试实战(一):文件传输全技法与深度解析
安全
TENSORTEC腾视科技26 分钟前
腾视科技重磅发布AD03行车记录仪DashCam!全维守护,智驭出行新生态
大数据·网络·人工智能·科技·ai·无人叉车解决方案·无人叉车及智能调度系统解决方案