4 云服务与低成本
云服务是把企业IT设备及专业管理人员的长期大笔资本开销(CapEx)转为以按需租赁为形式的运营开销(OpEx)。前面我们讨论过IT硬件设备更新过期速度越来越快,专业IT管理人员更是越来越稀缺资源。所以云服务的低成本特性从用户的角度来讲不言自明。这一节我们主要从后端数据中心的角度来讲云服务的低成本特性。
当我们考虑成本的时候,需要考虑硬件成本,管理成本和使用成本。硬件成本主要是指购置硬件所需要的费用,包括服务器,存储系统,网络设备,等等。人们往往会很直观地考虑硬件成本而忽视管理成本和使用成本。其实在大型数据中心,存储系统的管理、使用成本远远超过(可以数十倍于)硬件成本。
先来看管理成本方面。信息生命周期管理认为信息存在生命周期的不同阶段,包括产生、读取、更改、迁移、存档、回收等等。通过实现信息生命周期管理来帮助用户在信息的各个不同阶段以最低的成本获得最大的价值一直是工业界关注的一个问题。EMC是工业界重要的推动力量之一。CEO Joe Tucci早在2003年就认为信息生命周期管理是存储界的一次重要革新。实际上,将信息生命周期管理和云计算结合起来也能有效地降低管理成本。比如,在信息产生的初期,信息的价值相对较高。一个典型的例子是用户一般会频繁地访问最近收到的电子邮件。随着时间的流逝,该信息的价值越来越低。此时可以将该信息迁移到低速、低成本、低能耗的存储系统中以节约成本。当该信息需要后续服务时,将其重新迁移到高性能设备中以保证服务质量。重复数据删除技术(deduplication)主要用于备份系统中。它通过剔除冗余的数据,从而使用更少的存储资源(意味着更少的费用)来存储更多的数据。当该技术用于远程备份时,在源端进行重复数据删除还可以有效地减少网络流量。EMC通过收购Avamar,将重复数据删除技术纳入其备份软件,从而实现其备份软件的绿色化。基于以上技术,EMC 先后推出了Disk Library 3D 1500/3000,EMC Disk Library 4000, EMC Avamar Data Store二代 和EMC Avamar 4.0。这些技术使得EMC成为业界唯一能提供从软件到硬件整体解决方案的绿色存储供应商。
使用成本则主要包括运营大型数据中心所带来的电力的消耗,以及日常维护所需要的费用。以数据中心为例,数据中心不仅仅是一堆服务器和网络设备,还包括各种空调,和各种冷却设备。虽然由于计算机技术的发展,单位计算能力或者单位存储空间的能耗在逐年降低。但由于数据的爆炸性增长,其整体能耗是在逐年升高的。数据中心不仅是“吃的是电,挤出的是比特”,还同时产生了大量热量。所有的数据中心都要用冷却设备以保证设备的正常运行。前面我们提到过现代数据中心的极低利用率。尽管大量的资源被闲置,但仍旧需要消耗能量以应对随时可能达到的资源需求,因而仍旧需要冷却。由于计算机的绝大部分组件,包括CPU, 磁盘,内存,显示器,甚至网卡都支持不同的工作状态,不同的工作状态消耗不同的能量。比如,完全可以在低负载情况下降低CPU的频率以降低能耗。作为存储领域的领军,EMC一直致力于降低其存储系统的能耗,从低端到高端,从而实现绿色数字化,并且降低用户的使用成本。EMC于2008年4月在中国首先推出的新产品存储宝箱(StorageCredenza)内就使用了硬盘spindown技术,通过在低负载时将磁盘转入低能耗状态而节省能量。CEO Joe Tucci在2007年就曾表示要将该节能技术逐步应用到所有的EMC磁盘阵列产品中去,从而实现EMC产品的绿色化。EMC系列产品,Celerra 系列,CLARiiON 系列,EMC Centera 内容寻址存储 (CAS)系统,高端存储系统DMX-4系列的入门级产品—DMX-4 950磁盘阵列,都支持新的 750 GB SATA II 磁盘。对于相同的存储容量,单个大容量的磁盘比多个小容量的磁盘要消耗相对较少的能量。这一举措可使EMC的相关系列产品降低大约33% 的设备能耗。另外,由于固态磁盘(Solid State Drive,SSD)具有运转温度低、读取速度快、体积小以及耗电量少等特性,EMC也在其高端Symmetrix DMX-4当中搭载SSD。虽然SSD存在寿命问题,比如单块的擦除寿命大约在1,000,000次, 但EMC通过均匀磨损算法,采用大量的SSD尽量将要擦除的块均布在所有的SSD中来很好地解决了这个问题。
由于数据的爆炸性增长,大量的数据中心纷纷被建立起来以应对信息数字化的需求。然而,由于所有的数据中心都各自为阵,造成了两方面的后果。一是数据中心的大量有价值的信息形成了信息孤岛,无法被有需求的用户有效使用。二是由于所有的数据中心在建立的时候都会考虑在未来几年数据增长的需求,因此造成大量闲置的资源。云计算或者说云存储试图在这些孤立的信息孤岛之间通过提供灵活,安全,协同的资源共享来构造一个大规模的,地理上分布的,异构的资源池。从而充分提高系统的资源利用率,包括信息资源和硬件资源。再结合采用有效的信息生命周期管理技术、节能技术,云服务可以极大地降低IT的总体成本。