云计算 频道

X86架构破解云数据中心四大困惑

Advertisement

  【IT168 专稿】当云计算作为一种美丽的商业模式升起在IT界的上空时,省钱!提高利用率!……一系列的诱惑让企业的IT管理者们垂涎三尺。《哈佛商业评论》主编在“The Big Switch:Rewiring the World, from Edison to Google”一文中描述了云计算的美好愿景,它可以让人们像使用电力一样使用计算资源。

  然而,现实与理想总是存在着落差,就在无数IT人士为之折腰的同时,云计算的发展也面临着诸多障碍:法规遵从和安全性、灵活性、可靠性、计算密度和能效等重重障碍让许多“追捧者”只能望洋兴叹。

  如何才能拥有一个云计算的数据中心?如何才能充分享受云计算带来的诸多好处?如何才能不在云计算的浪潮中被淘汰?……企业CIO们开始了一轮又一轮疯狂的探索,他们试图寻觅一种非常好的的云计算实践方案,一个在计算、网络、存储等各个方面都最优的解决方案。本文将结合云计算数据中心所面临的四个方面的困惑,包括安全性、灵活性、RAS特性、计算密度和能效等,从处理器技术出发,阐述X86架构如何帮助用户打造企业云计算数据中心的非常好的实践。

  云数据中心困惑之一:安全性

  X86架构非常好的实践之道:Intel可信执行技术+AES指令集

  由于云计算架构的特点,数据很可能被分散地存储在不同的地方,并且都按照明文的方式进行存储,这极大地威胁了数据的隐私性和安全性。一般的杀毒软件和防火墙只能在操作系统中运行,而对处于操作系统之下的VMM无能为力,因此VMM经常游离于安全保护之外。

  Intel处理器的可信执行技术(Trusted Execution Technology,TXT)前身为Intel LaGrande安全技术,从07年开始更名。它使用硬件密钥和子系统双路控制内部资源,并决定哪些程序、哪些用户允许访问或拒绝访问这些资源,从硬件层面增强了资源的安全性。

X86架构破解云数据中心四大困惑
▲图1 Intel可信执行技术的工作原理:通过为每一个授权登录的组件创建一个唯一的加密标识,并提供基于硬件执行的机制来阻止任何与授权代码不一致的代码运行

  Intel可信执行技术由博锐芯片组、作业系列及Virtual Machine软件共同构成,一起保护重要资料避免被攻击。Intel可信执行技术要求提供的功能包括五个方面的内容:Protected Execution——未取得授权下无法执行其他软体;Sealed Storage——提供硬件加密及储存金钥,无法在其他平台上使用及开启;Protected Input ——所有输入端均需要认证,例如USB硬件、在无正确密识下没法开启;Protected Graphics ——不容许画面被非法提取;Protected Launch ——可控制作业系统及系统主要元件工具,不会被开始或重写/改写/登记等动作。

  除了Intel可信执行技术之外,从32nm的Westmere架构开始,X86架构中还添加了AES(Advanced Encryption Standard,AES)指令集,包含六条指令,其中包括四条针对AES加解密操作的指令集、两条支持密钥扩展的指令集。AES指令集在硬件设计上实现了对AES加密的支持,与用软件实现AES加密相比,极大地优化了数据加密和解密过程的速度和安全性。

  云数据中心困惑之二:灵活性

  X86架构非常好的实践之道:Intel VT FlexMigration

  “按需使用”计算资源是云计算最大的优势之一,从开篇提到的“The Big Switch”一文对于云计算愿景的描述也可得见。所谓的“按需使用”其实就是我们所要讲的云计算的“灵活性”,从技术的角度上讲,云计算的灵活性主要是指通过对数据中心的资源进行有效地组织,根据应用需求的变化,快速、自动地分配资源。要提供这样灵活性并非一件容易的事情,尤其是在数据中心的环境日趋复杂的情况下。

  英特尔虚拟化灵活迁移技术( Intel VT FlexMigration)让多代服务器之间的无缝迁移成为可能。它能够让管理程序在迁移池内的所有服务器中建立一套一致的指令,这样,从一个老机器迁移到一个新机器,或者迁移到未来的一个新机器的时候,始终都是一个二进制的迁移,不需要重新做任何转换工作。

  这就实现工作负载在多代服务器之间无缝迁移,即使未来的处理器系统可能包括增强的指令集仍然可以进行无缝迁移,这极大地增强了灵活性,并且保护了用户投资。

云数据中心困惑之二:灵活性
▲图2英特尔虚拟化灵活迁移技术可在多代硬件中无缝运行的更加灵活、统一的服务器资源池

  云数据中心困惑之三:RAS特性

  X86架构非常好的实践之道:移植来自安腾的20多条RAS特性

  RAS特性即“可靠性、可用性、可服务性”(Reliability, Availability and Serviceability)。

  云计算中心的RAS特性也是一个不容忽视的问题。一方面,对于云服务提供商来说,高的RAS特性很重要,数据中心服务器故障导致应用停用将给客户和终端用户造成损失,最终导致用户流失。另一方面,对于用户自己的数据中心来说,高RAS特性就更重要了,业务应用的停用,尤其是关键业务,比如金融行业业务支撑系统,一旦出现故障,将会造成十分巨大的损失。调研数据表明,服务器宕机1分钟,平均会使运输业损失15万美元,银行业损失27万美元,通信业损失35万美元,制造业损失42万美元,证券业损失45万美元,这是真正的一刻值千金啊。

  随着至强在高端服务器领域的不断应用,除了基本的高性能以外,使用者对至强的RAS要求也越来越高,希望至强成为一个高效、节能、可靠的关键应用基础平台。从至强7500开始,包括其后的E7系列,Intel将英特尔安腾平台的、可与RISC架构平台相抗衡的20多个高级RAS特性移植到X86处理器中,并首次在至强平台上实现了IA64上才有的MCA恢复功能,提供更强的可靠性。

  MCA恢复功能可以检测处理器、内存和I/O的错误,并与操作系统协作纠正,帮助系统从严重错误中恢复,避免了因为内存等的一点硬件错误,就导致整个系统的瘫痪。下图为其工作原理:

云数据中心困惑之三:RAS特性
▲图3 MCA恢复功能的工作原理

  云数据中心困惑之四:计算密度和能效

  X86架构非常好的实践之道:英特尔节点管理器与数据中心管理器完美结合

  云计算往往意味着大量的服务器,如何在有限的空间和能耗下提高服务器计算密度成为云计算数据中心的又一难题。

  英特尔节点管理器(Intel Node Manager)从Nehalem-EP平台开始引入X86架构。它为独立的服务器提供能耗温度监控和基于各种策略的能源管理,可以通过基于规范IPMI协议的接口、由支持的基板管理控制器(BMC)使用,需要一个类似PMBusTM的仪器供电源。

  节点管理器通过与Intel 数据中心管理器(Data Center Manager,DCM)相结合,可以在不受操作系统限制的情况下便捷管理数据中心,为用户提供最优的数据中心能耗管理方案。

云数据中心困惑之四:计算密度和能效
▲图4 Intel节点管理器的反馈循环,电压和CPU频率由ACPI标准下的P-state决定

  英特尔数据中心管理器 (IntelDataCenterManager)是监控、管理数据中心的机架和服务器组电、热等能耗的软件技术,IT部门利用它来实现提高机架密度、降低能耗与散热成本,从而优化机房布局并轻松获益。

  数据中心管理产品器具备三大基本功能,即监测、管控和报表,用户可以根据数据中心的情况,优化并使用策略。这意味着,在服务器上,用户第一次有能力对服务器功耗使用策略。并且,基于能源使用策略,还可以对整个数据中心进行优化配置。

  除了优化能效之外,节点管理器和数据中心管理器相结合的方案还可以增加机房和机架密度、节约空间。事实上,很多时候计算密度不是空间受限制,而是能耗受限制,比如42U服务器机架放不满是因为提供机架的能源、电源不够。而通过数据中心管理器,可以增加每个机架的密度,能源动态分配,充分利用机架空间,增加机房和机架的密度。

  从90年代开始,X86架构的服务器以其开放性和性价比的优势开始抢食RISC的市场,到2010年Xeon 7500的推出,X86架构服务器在性能和RAS特性方面也已经足以抗衡甚至超越RISC架构,而成本上只有对方的20%-50%。基于Intel X86架构的服务器通过处理器级别的优化,为用户构建云计算数据中心提供了非常好的的实践。

0
相关文章