云计算 频道

Google全球三大数据中心自然冷却方案

  【IT168 资讯】Google将其数据中心技术作为一个核心竞争力,很少对外公布其技术细节,因此搜索巨人的数据中心一直是个谜。近日,谷歌公布了其数据中心能耗发展的图表,在图表中显示近年来谷歌在能耗控制方面有了明显的进步。在2010年第一季度,谷歌新建的数据中心综合电力使用效率为1.16(PUE),其中一个数据中心的PUE值达到了1.09。从公布的这些图表中,在纵向上我们可以看到Google在全球各地的多个数据中心PUE控制都已经达到非常高的水平;在横向上看曲线整体倾斜向下,说明还是个逐步改进、不断优化的精细化运营调优过程。这些图表的另一个显著特点是各个数据中心的PUE值随着时间轴,不管是在不同的季节,还是在一天的不同时间点上都表现出较大的波动性,说明Google数据中心的自然冷水平非常高。结合室外自然环境温度,尽量利用外界冷源带走热量,能不开启机械制冷就不启动。在散热方面只给够用的冷量,绝不浪费。

Google全球三大数据中心自然冷却方案

  左:Google多个数据中心的多年PUE曲线 右:Google某一数据中心的日PUE曲线

  本文针对Google数据中心的这些特点,将介绍Google位于欧洲的三个不同实现自然冷却方式的机房,这些机房都实现了100%自然冷却,都是没有chiller(制冷机组)的典型应用案例,分别是比利时水侧自然冷数据中心、爱尔兰空气侧自然冷数据中心和芬兰海水直接冷却数据中心。

  当然本文提到的这些数据中心技术和机房所在当地的气候、政策、资源等相关,且属于完全定制的数据中心,不好为国内直接移植和借用,但思路和创新精神非常值得国内同行学习借鉴。

  1、比利时数据中心

  Google比利时的数据中心位于Saint - Ghislain,该数据中心的第一阶段在2008年初投入,并于2011年Q1完成全部阶段设计。2011年Q1的PUE可以低达1.09,而全年平均PUE可达到1.11。该数据中心采用蒸发冷却系统,从附近的工业运河抽取用水。“我们设计并制作了一个站内的水处理厂,”Kava说道,“这样我们就不用使用供应城市的可饮用水”。该数据中心利用运河的冷水来带走热量,并自己修建水处理厂,再将处理后的运河水给数据中心提供冷量,只采用冷却塔来散热,无chiller,实现了100%水侧自然冷机房,是谷歌的第一个完全自然冷却的数据中心。

Google全球三大数据中心自然冷却方案

  距离数据中心大约400米外的工业运河,Google建设了现场的水处理工厂,直接从运河中抽取河水。由于运河的水质比较糟糕,必须过滤处理并净化到工业用水标准,但Google也不会将河水过滤处理到非常干净的水平,只要可用于制冷散热即可。然后用水泵将净化后的冷水输送到模块化储冷大水罐,再供给到各个冷却塔,用于后续蒸发冷却。这个过程结果不仅冷却了服务器,还清洁了水源,当地的部长也称赞Google说这是一次双赢的合作。

Google全球三大数据中心自然冷却方案

 

  整个水处理厂的污水处理过程如下图所示:

Google全球三大数据中心自然冷却方案

  Google在比利时的数据中心中采用了模块化的无chiller自然冷却系统,通过下图中的热交换器热交换原理,将室内的热量通过存于水箱中温度较低的、处理过的运河水从冷却塔带走,实现无需机械制冷的目的。

Google全球三大数据中心自然冷却方案

  比利时的气候几乎可以全年支持免费的冷却,平均每年只有7天气温不符合免费冷却系统的要求。Kava指出,机房温度不需要像以前那样低。在2008年的时候,美国加热冷冻及空调工程师协会(ASHRAE)建议数据中心的温度应保持在20到25摄氏度之间--但Google建议将其保持在27度以上。“构建一个高效的数据中心的第一步就是简单的提高它的温度,”Kava说,“机器、服务器、存储阵列、任何东西在比一般数据中心保持的温度高的多的地方都能很好的运行。对我而言,任何数据中心在18或20摄氏度以下运行都是相当可笑的。”

Google全球三大数据中心自然冷却方案

  在比利时这里,有时候会热的连服务器都不能运行,这时 Google 就会将这里的工作移交给其他数据中心负责。Kava 没有给出任何细节,但他表示这种数据中心之间的工作交接涉及到一个叫做 Spanner 的软件平台。这个 Google 设计的平台曾在 2009 年 10 月的一个谈论会上有所提及,但是这是 Google 第一次公开确认 Spanner 确实有在使用。

Google全球三大数据中心自然冷却方案

  根据 Google 在2009年的讨论会上的陈述,Spanner 是一个“存储及计算系统,遍及他们所有的数据中心,并基于限制及使用特点来自动转移和增加数据和计算的副本。”这包括涉及带宽、丢包率、能源、资源及“失败模式--比如当数据中心内部出现错误的时候。

0
相关文章