一句话点评:此故障事件是2108年GKE服务故障最久的一次,先前最严重的故障事件发生在1月8日,该服务的丛集建置功能停摆了2小时后恢复正常。
▲特殊贡献奖之GKE服务最长宕机奖:谷歌云
事件介绍:2018年11月份,Google公有云下的Kubernetes服务(GKE),从11月9日凌晨4点30分开始,当机了将近19小时,直至当日深夜11点才完成修复,此消息也在知名开发者论坛Hacker News引起相当讨论。
谷歌GKE服务被曝宕机 业务中断约19小时 。根据Google所发布的公告,GKE服务从11月9日凌晨4点30分起,Kubernetes节点池建置功能出现异常,维运人员无法透过Cloud Console UI建立新节点,该公司随即分派工程团队调查故障原因,并开始着手维修。到了当日清晨5点57分,该公司表示,受到影响的企业用户,可以先改为使用GCP内建的gcloud command,建置新Kubernetes节点。经过10个小时的维修,Google在下午2点30分时宣布,Cloud Console UI建立节点池功能已经恢复正常。
获奖理由:谷歌云GKE服务达19个小时的宕机,看似是一个笑话,但却为用户再次敲响了云安全的警钟。不管是云提供商还是用户,数据备份和数据安全是永恒话题。