云计算·大数据 频道

AWS DNS 错误导致DynamoDB业务中断,波及多个服务和客户

  凌晨时分,美国东部地区的DynamoDB错误率急剧上升,导致其他AWS服务出现波动,并影响了众多客户。这一事件突显了即使是单一API的故障也可能对广泛的云服务生态系统产生重大影响。

  事件背景

  亚马逊网络服务(AWS),作为亚马逊的子公司,提供按需云计算平台,是全球数百万客户的首选。然而,在本周一,由于DNS问题导致DynamoDB API变得不可靠,许多依赖于AWS的服务遭受了严重影响。尽管问题波及面仅限于一个特定区域,但由于该地提供的是关键数据库服务,所以此次事故不仅影响到了该地区的用户,也波及到其他地区和服务。

  受影响的公司和服务

  人工智能搜索公司Perplexity报告称该公司因AWS运营中断而受到影响。虽然在线设计工具Canva并未直接将AWS列为问题根源,但报告显示底层云服务提供商出现了严重问题,导致用户在同一时间窗口内的错误率有所提高。此外,实时监控服务Downdetector指出Venmo、Roku、Lyft、Zoom以及麦当劳应用程序的中断可能与亚马逊网络服务中断有关。

  AWS快速做出响应

  服务中断后,AWS在凌晨12时11分(太平洋时间)第一时间报告了该事件:“我们正在调查美国东地区多个AWS服务的错误率和延迟增加的情况。”经过进一步调查,一个多小时后,AWS缩小了问题范围至DynamoDB终端,并确认问题与DNS分辨率相关。到凌晨2点27分,AWS实施了初步缓解措施,并建议客户重新处理未通过的请求。三小时后,AWS宣布依赖美国东一号的全球服务和功能已恢复,并承诺在获得更多信息后进行进一步更新。

  此次事件再次提醒了企业和个人关于云服务可靠性的重要性,以及即使是最小的技术故障也能引发广泛影响。对于AWS而言,这也是对其应对突发事件能力的一次考验。

0
相关文章