1.1 云计算的概念
“云计算”这个词相对于“分布式计算”或“网格计算”等技术类名词的确显得更加浪漫,甚至很难让人们从这个词本身推断它所涵盖的范畴。事实上,不但第一次听说“云计算”的普通技术工作者会感到不知所云,就连众多行业精英和学术专家们也很难为云计算给出一个准确的定义,每个人从不同的角度会有不同的解释。本节将首先呈现云计算的四个典型案例,并以这些案例为脉络,探究云计算的内涵,领略云中的真实世界。
1.1.1 走近云计算
1. 相关案例
【案例一】
2008年3月19日上午10点,美国国家档案馆公开了希拉里·克林顿在1993~2001年作为第一夫人期间的白宫日程档案。由于这些档案是新闻记者团体和独立调查机构依据“信息自由法案”向国会多次请愿才得以公开的,因此具有极高的社会关注度与新闻时效性。但是,这些档案是不可检索的低质量PDF文件,若想将其转换为可以检索并便于浏览的文件格式,需要进行再处理。华盛顿邮报希望将这些档案在第一时间上传到互联网,以便公众查询,但是据估算仅每一页的操作,以报社现有的计算能力就需要30分钟。因此,华盛顿邮报将这个档案的转换工程交给Amazon EC2(Elastic Compute Cloud)。Amazon EC2同时使用200个虚拟服务器案例,每个服务器的单页平均处理时间都缩短为一分钟,并在9小时内将所有的档案转换完毕,以最快的速度将这些第一手资料呈现给读者。
Giftag是一款Web 2.0应用,它能被以插件的形式安装在Firefox和IE浏览器上。互联网用户在浏览网页,尤其是在浏览购物网站的时候,可以利用这个插件将心仪的商品加入到由Giftag维护的商品清单中,并将这个清单与好友分享。这个应用一经推出,便广泛流行起来,注册用户数量激增,每天Giftag的服务器都要响应数以百万计的请求,并存储用户提交的海量信息,没过多久服务器就不堪重负。后来,Giftag将应用迁移到Google App Engine(GAE)平台,基于GAE的开放API,Giftag可以利用Google具有可伸缩性的计算处理性能来响应高峰期的用户请求,利用Google的分布式数据库来存储用户数据,甚至可以使用Gmail邮箱和Google的搜索功能来增强用户体验。Giftag实现了从一个初创的Web
2.0应用向一个稳定的、持续增长的网络服务的平稳过渡。
【案例三】
哈根达斯是著名的冰激凌供应商,其加盟店遍布世界各地。因此,公司需要一个CRM(客户关系管理)系统对所有的加盟店进行管理。当时哈根达斯用Excel表单来管理和跟踪主要的加盟店,用Access数据库来存储协议加盟店的数据,但是使用虚拟专用网(VPN)来访问该数据库的效果总是不太好。因此,公司急需一个能够让分布在各地的员工沟通协作的解决方案,并且该方案应该能够根据不同的需求进行灵活配置。哈根达斯公司选择了Salesforce CRM企业版,应用系统在不到6个月的时间就上线了。除此之外,该系统将Microsoft Outlook和SalesforceCRM集成了起来,从而使员工能够轻松地访问Outlook中的联系人列表、日程和商业信息。Salesforce.com还为哈根达斯的解决方案提供了员工培训模块、加盟店跟踪模块,以及新店选址模块。哈根达斯公司用更少的成本获得了超预期的效果。
【案例四】
国际商业机器公司(IBM)作为全球整合的大型跨国企业,在全球共拥有9所研究院,汇聚了3000多位顶尖的科学家和研究员。在他们之中共有6位诺贝尔奖获得者和6位图灵奖获得者。在2009年,共有4914项美国专利在IBM诞生。在这里,每天都有不计其数的科学实验在进行着,其中有些实验需要有海量的计算和存储资源作为支撑。虽然每所研究院都配备了先进的IT设备,但仍然满足不了某些实验的需求。除此之外,由于这些研究院分布在世界各地,处于不同的时区,给合作科研提出了挑战。为了给研究部门的创新提供源源不断的支持,也为提高各研究院间的沟通协作效率,IBM公司构建了IBM Research Compute Cloud(RC2)将分散在各个研究院的资源系统(如服务器、存储)整合,为公司内部所使用。该系统为科研人员提供了共享计算和存储资源的平台,通过任务调度和安排,为每一项科学实验提供了有保障的动态资源供给,而且不需要科学实验人员来管理这些资源。不仅如此,不论是实验的中间流程还是最终结果都是在该系统中完成和保存的,所以有效地保证了数据的安全,并使得身处世界各地的研究人员随时可以对它们进行查询和交换。这一切大大提高了协同科研的效率,为IBM公司不断深入的创新提供了强大的推动力。
2. 案例分析
在案例一中,如果没有Amazon EC 2提供的计算能力,华盛顿邮报需要超过一年的时间来完成全部档案的格式转换工作。显然,这样的效率不能满足新闻的时效性和公众对于信息的期盼。恰恰是Amazon公司通过其EC2平台,将计算资源打包提供给客户,使报社在9小时内就得到了1407小时的虚拟服务器机时,在第一时间完成了档案的转换,而华盛顿邮报仅需要向Amazon公司支付144.62美元的费用。
在案例二中,Giftag公司和其他初创型Web 2.0公司一样,面临着高昂的基础设施投入费用,如购置服务器、租用带宽等。而基础设施的投入往往是不易估量的,如果一次投入过大而应用并没有达到预期的流行度,就会造成投资的浪费;反之,如果应用获得了超预期的反响,用户数量激增,那么就会给服务器、带宽带来巨大的压力,从而造成应用服务质量下降和客户的流失。此外,Web应用需要复杂的软件配置,包括数据库、中间件、Web服务器等要素,如果其中一项配置得不合理,就会产生连锁反应,影响整个应
用的表现。这些潜在问题都给创业公司提出了巨大的挑战。在GAE平台上,Giftag可以将自己的精力集中于应用本身,而将诸如服务器动态扩展、数据库访问、负载均衡等各个层次的问题交给GAE平台来解决。正是由于GAE将Web应用所需的基础功能作为服务提供给了Giftag,才使得其可以专注于应用的开发和优化。
在案例三中,哈根达斯公司要搭建自己的CRM平台,传统的做法是先聘请一支专业的顾问团队研究公司的业务流程,建模分析并提出咨询报告。然后再雇用一家IT外包公司,进驻自己的公司对平台进行开发,可能会多次出现需求→设计→实施→需求变更→再设计→再实施的循环。同时,哈根达斯作为一家冰淇淋制作厂商,还需要投资IT设备,如购买服务器、交换机、防火墙、各种各样的软件,以及租用带宽等,为系统上线做准备。经历了这令人精疲力竭的过程后系统终于上线了,但它是不是真的满足了哈根达斯公司最初的愿望呢,可能永远不会有人知道和提起了。幸运的是,哈根达斯公司没有重复这条被别的公司走过无数次的老路。Salesforce.com作为CRM系统的专业提供商,对这个领域有着精深的理解。同时,它能够将已经完成的CRM应用模块打包,供用户选择。用户只需要如同在超市选购商品一样选择自己需要的功能模块,让Salesforce.com进行定制集成,一个属于自己的CRM系统就完成了,系统的上线和维护也将由Salesforce.com的专业团队负责。这样,一家非IT公司就可以专注于它的主营业务,使IT真正成为公司的支撑,而不是拖累。
在案例四中,IBM公司分布在世界各地的9所研究院虽然各自拥有强大的IT基础设施,但有时单个科学实验对资源的需求超出了其所在研究院具有的资源规模,而且以往各自分割独立的组织方式很难让各个机构间协作完成一项工作。实际上,蓝色巨人IBM一直在努力整合自己的IT资源,以降低运营成本。早在2007年,IBM公司就开始着手将运行在3900台服务器上的业务迁移到30台大型机上,从而减少了80%的电力消耗,同时也促进了公司业务的整合。IBM Research Compute Cloud(RC2)的建立把分散于各地的资源从物理和逻辑上整合在一起,为研究院的科研提供了一个近乎取之不尽的资源池。此外,计算资源的整合带动了业务的整合,研究员们可以在IBM RC2上共享实验所需的工具、平台甚至是结果,大大加速了科研的进程。值得注意的是,与前三个案例不同,IBM RC2是供IBM公司内部使用的私有系统,而不是一个为公司以外的用户提供服务的第三方公用平台。
通过以上四个典型案例,相信读者已经初步领略到了云计算的魅力和价值。是的,云计算就是一种更加智慧的信息技术,它化繁为简、化难为易、化不可能为可能。
本文摘自《虚拟化与云计算》一书第一章