据微软称,2024年1月21日01:57 UTC到08:58 UTC之间,使用Azure资源管理器(ARM)的客户在执行资源管理操作时可能遇到了问题。
这影响了Azure CLI、Azure PowerShell、Azure 门户,以及依赖 ARM 进行内部资源管理操作的 Azure 服务的用户。
不出所料,用户迅速在社交媒体上表达他们对这些问题的不满。
微软表示,“后端服务进行了配置更改,导致ARM Web角色崩溃。”
解决方法是什么?通过绕过配置更改,让一切恢复正常。这就是传说中的微软质量控制工作。
遗憾的是,从用户反馈来看,所有Azure服务都需要更长的时间才能恢复。不过,无论如何,7个小时的中断也是不容忽视的。
微软承诺,将在周三发布一份初步的事后分析报告( PIR ),介绍初步的根本原因和修复措施。我们将在14天后发布最终的PIR,到时会深入剖析这起事件。
就微软而言,在允许后台服务因配置更改而造成严重破坏之前,多进行一些测试是有益的。
这并不是Azure遭受的第一次宕机。
2019年5月3日凌晨3点43分开始,微软的Azure在全球范围内出现了大面积宕机,整个过程持续了将近2个小时。受Azure宕机影响,包括Microsoft 365,Dynamics和DevOps在内的微软主要服务均出现使用问题。
在2021年10月13日05:12 UTC和11:45 UTC之间,使用Windows虚拟机的Azure客户子集在执行服务管理操作时面临问题——如启动、创建、更新、删除。新虚拟机的部署和更新也失败了。
在2023年1月25日下午4点半,微软于推特发文通知用户Azure发生网络问题,当客户尝试访问公共Azure地区中的Azure资源,以及Microsoft 365和PowerBI,可能出现网络延迟或是超过时等网络连接问题。