全球云服务震荡:Amazon Web Services (AWS) 出现大规模故障 多项线上服务受冲击

多款知名应用同时瘫痪,故障源自美国东部 US-EAST-1 区域,全球连锁反应急速蔓延


正文

【城市,日期】------ 2025 年 10 月 20 日,全球云计算服务巨头 Amazon Web Services (AWS) 遭遇严重服务中断,影响了包括 Amazon 自家服务、Alexa 智能助手、Snapchat、Fortnite 在内的多款热门线上应用。

据《The Verge》报道:

"A major outage at Amazon Web Services (AWS) has disrupted numerous online services including Amazon, Alexa, Snapchat, Fortnite, and more."

(一场影响广泛的 AWS 宕机事件扰乱了包括 Amazon、Alexa、Snapchat 与 Fortnite 在内的众多在线服务。)

(theverge.com)

AWS 在其服务状态页面中提示,目前正"investigating increased error rates and latencies for multiple AWS services in the US-EAST-1 Region"(正在调查 US-EAST-1 区域多项 AWS 服务的错误率和延迟升高问题)。虽然故障源自美国东部,但已有迹象显示其他区域亦受到波及。

"The issue is primarily affecting the US-EAST-1 region but appears to have global repercussions."

(问题主要集中在 US-EAST-1 区域,但似乎已产生全球性连锁反应。)

(theverge.com)

用户在 Reddit 上报告称:"The Alexa smart assistant is down and unable to respond to queries or complete requests."(Alexa 智能助手已停止响应,无法执行任何请求。)

(theverge.com)

受影响服务概况

  • 多家媒体和用户报告,Alexa 语音助手、智能家居设备、线上游戏、社交媒体应用均出现响应缓慢或完全无法访问的情况。
  • Perplexity AI 首席执行官在 X 平台(原 Twitter)发文称:"The root cause is an AWS issue. We're working on resolving it."(根本原因是 AWS 问题,我们正在努力修复。)
  • AWS 尚未披露故障根本原因,也未给出完全恢复的时间表。其健康仪表板中,多项服务状态被标注为 "Impacted" 或 "Degraded"。

云服务的脆弱暴露

此次事件再次凸显了企业与个人对单一云服务提供商依赖所带来的系统性风险。历史上,AWS 多次因数据中心失误、网络配置错误或区域性异常而引发广泛中断。AWS 官方在文档中指出,当发生"impact a significant percentage of a service's infrastructure, resources or APIs"(影响服务基础设施、资源或 API 中大量比例)的事件时,公司将发布 Post-Event Summary 报告披露细节与改进方案。

对客户与企业的影响

  • 对企业而言,运行于 AWS 平台的关键应用若受中断,可能导致业务停摆与收入损失。
  • 对用户而言,从智能家居控制到社交娱乐,体验受损直接可感。
  • 对于缺乏多区域冗余或灾备机制的组织而言,此次事件是一次强烈警示:必须加快多云部署与异地容灾策略建设。

AWS 的应对与建议

目前,AWS 正在调查此次宕机原因。建议用户:

  1. 登录 AWS 控制台,在 "AWS Health Dashboard" 查看账户所属区域的专属事件报告。
  2. 若受影响区域包括 AP-SOUTHEAST-2(悉尼)或 AP-NORTHEAST-1(日 本)等亚太节点,建议立即切换备用 Region。
  3. 重新评估 multi-region 与 multi-cloud 架构,强化冗余与备份。
  4. 关注 AWS 官方 X 账号 @awscloud 与状态页获取最新通告。

结语

截至目前,AWS 的大规模服务中断尚未完全恢复。此次事件不仅暴露出云计算体系的潜在脆弱性,也再次提醒全球用户云服务冗余与风险管理的重要性。

最新实测更新:

截至发稿时,VercelSlack 等依赖 AWS 基础设施的服务亦已无法正常访问,显示此次宕机影响正在持续扩大。

相关推荐
A小辣椒1 天前
AWS Clould Support Engineer就职面试题
aws
tiancaijiben3 天前
阿里云Kubernetes集群托管完全指南:从创建到生产级运维
云计算
亚林瓜子3 天前
AWS WAF中如何放行某个触发了托管规则的接口
aws·waf
互联网推荐官3 天前
上海软件定制开发公司推荐:从PaaS工程化路径看D-coding的技术取舍
云原生·云计算·paas·软件开发·开发经验·上海
sbjdhjd3 天前
从零搭建企业级 CI/CD(下):Jenkins+GitLab+Harbor 全链路实战指南
git·servlet·ci/cd·云原生·云计算·gitlab·jenkins
tiancaijiben3 天前
阿里云应用实时监控服务ARMS完全接入指南:从探针部署到全链路可观测
云计算
xingyuzhisuan4 天前
算力租赁平台 GPU 资源隔离方案:显存抢占问题深度排查与解决
大数据·云计算·gpu算力
workbuddy小能手4 天前
腾讯云ADP Agent Portal vs 自建智能体:架构选型对比
架构·云计算·腾讯云
宸津-代码粉碎机4 天前
Spring AI 企业级实战|智能记忆摘要+自动遗忘机制落地,彻底解决上下文爆炸与Token冗余
java·大数据·人工智能·后端·python·spring·云计算