云计算 频道

云计算是什么意思?云计算的概念

  1.1 云计算的概念

  “云计算”这个词相对于“分布式计算”或“网格计算”等技术类名词的确显得更加浪漫,甚至很难让人们从这个词本身推断它所涵盖的范畴。事实上,不但第一次听说“云计算”的普通技术工作者会感到不知所云,就连众多行业精英和学术专家们也很难为云计算给出一个准确的定义,每个人从不同的角度会有不同的解释。本节将首先呈现云计算的四个典型案例,并以这些案例为脉络,探究云计算的内涵,领略云中的真实世界。

  1.1.1 走近云计算

  1. 相关案例

  【案例一】

  2008年3月19日上午10点,美国国家档案馆公开了希拉里·克林顿在1993~2001年作为第一夫人期间的白宫日程档案。由于这些档案是新闻记者团体和独立调查机构依据“信息自由法案”向国会多次请愿才得以公开的,因此具有极高的社会关注度与新闻时效性。但是,这些档案是不可检索的低质量PDF文件,若想将其转换为可以检索并便于浏览的文件格式,需要进行再处理。华盛顿邮报希望将这些档案在第一时间上传到互联网,以便公众查询,但是据估算仅每一页的操作,以报社现有的计算能力就需要30分钟。因此,华盛顿邮报将这个档案的转换工程交给Amazon EC2(Elastic Compute Cloud)。Amazon EC2同时使用200个虚拟服务器案例,每个服务器的单页平均处理时间都缩短为一分钟,并在9小时内将所有的档案转换完毕,以最快的速度将这些第一手资料呈现给读者。

  Giftag是一款Web 2.0应用,它能被以插件的形式安装在Firefox和IE浏览器上。互联网用户在浏览网页,尤其是在浏览购物网站的时候,可以利用这个插件将心仪的商品加入到由Giftag维护的商品清单中,并将这个清单与好友分享。这个应用一经推出,便广泛流行起来,注册用户数量激增,每天Giftag的服务器都要响应数以百万计的请求,并存储用户提交的海量信息,没过多久服务器就不堪重负。后来,Giftag将应用迁移到Google App Engine(GAE)平台,基于GAE的开放API,Giftag可以利用Google具有可伸缩性的计算处理性能来响应高峰期的用户请求,利用Google的分布式数据库来存储用户数据,甚至可以使用Gmail邮箱和Google的搜索功能来增强用户体验。Giftag实现了从一个初创的Web

  2.0应用向一个稳定的、持续增长的网络服务的平稳过渡。

  【案例三】

  哈根达斯是著名的冰激凌供应商,其加盟店遍布世界各地。因此,公司需要一个CRM(客户关系管理)系统对所有的加盟店进行管理。当时哈根达斯用Excel表单来管理和跟踪主要的加盟店,用Access数据库来存储协议加盟店的数据,但是使用虚拟专用网(VPN)来访问该数据库的效果总是不太好。因此,公司急需一个能够让分布在各地的员工沟通协作的解决方案,并且该方案应该能够根据不同的需求进行灵活配置。哈根达斯公司选择了Salesforce CRM企业版,应用系统在不到6个月的时间就上线了。除此之外,该系统将Microsoft Outlook和SalesforceCRM集成了起来,从而使员工能够轻松地访问Outlook中的联系人列表、日程和商业信息。Salesforce.com还为哈根达斯的解决方案提供了员工培训模块、加盟店跟踪模块,以及新店选址模块。哈根达斯公司用更少的成本获得了超预期的效果。

  【案例四】

  国际商业机器公司(IBM)作为全球整合的大型跨国企业,在全球共拥有9所研究院,汇聚了3000多位顶尖的科学家和研究员。在他们之中共有6位诺贝尔奖获得者和6位图灵奖获得者。在2009年,共有4914项美国专利在IBM诞生。在这里,每天都有不计其数的科学实验在进行着,其中有些实验需要有海量的计算和存储资源作为支撑。虽然每所研究院都配备了先进的IT设备,但仍然满足不了某些实验的需求。除此之外,由于这些研究院分布在世界各地,处于不同的时区,给合作科研提出了挑战。为了给研究部门的创新提供源源不断的支持,也为提高各研究院间的沟通协作效率,IBM公司构建了IBM Research Compute Cloud(RC2)将分散在各个研究院的资源系统(如服务器、存储)整合,为公司内部所使用。该系统为科研人员提供了共享计算和存储资源的平台,通过任务调度和安排,为每一项科学实验提供了有保障的动态资源供给,而且不需要科学实验人员来管理这些资源。不仅如此,不论是实验的中间流程还是最终结果都是在该系统中完成和保存的,所以有效地保证了数据的安全,并使得身处世界各地的研究人员随时可以对它们进行查询和交换。这一切大大提高了协同科研的效率,为IBM公司不断深入的创新提供了强大的推动力。

  2. 案例分析

  在案例一中,如果没有Amazon EC 2提供的计算能力,华盛顿邮报需要超过一年的时间来完成全部档案的格式转换工作。显然,这样的效率不能满足新闻的时效性和公众对于信息的期盼。恰恰是Amazon公司通过其EC2平台,将计算资源打包提供给客户,使报社在9小时内就得到了1407小时的虚拟服务器机时,在第一时间完成了档案的转换,而华盛顿邮报仅需要向Amazon公司支付144.62美元的费用。

  在案例二中,Giftag公司和其他初创型Web 2.0公司一样,面临着高昂的基础设施投入费用,如购置服务器、租用带宽等。而基础设施的投入往往是不易估量的,如果一次投入过大而应用并没有达到预期的流行度,就会造成投资的浪费;反之,如果应用获得了超预期的反响,用户数量激增,那么就会给服务器、带宽带来巨大的压力,从而造成应用服务质量下降和客户的流失。此外,Web应用需要复杂的软件配置,包括数据库、中间件、Web服务器等要素,如果其中一项配置得不合理,就会产生连锁反应,影响整个应

  用的表现。这些潜在问题都给创业公司提出了巨大的挑战。在GAE平台上,Giftag可以将自己的精力集中于应用本身,而将诸如服务器动态扩展、数据库访问、负载均衡等各个层次的问题交给GAE平台来解决。正是由于GAE将Web应用所需的基础功能作为服务提供给了Giftag,才使得其可以专注于应用的开发和优化。

  在案例三中,哈根达斯公司要搭建自己的CRM平台,传统的做法是先聘请一支专业的顾问团队研究公司的业务流程,建模分析并提出咨询报告。然后再雇用一家IT外包公司,进驻自己的公司对平台进行开发,可能会多次出现需求→设计→实施→需求变更→再设计→再实施的循环。同时,哈根达斯作为一家冰淇淋制作厂商,还需要投资IT设备,如购买服务器、交换机、防火墙、各种各样的软件,以及租用带宽等,为系统上线做准备。经历了这令人精疲力竭的过程后系统终于上线了,但它是不是真的满足了哈根达斯公司最初的愿望呢,可能永远不会有人知道和提起了。幸运的是,哈根达斯公司没有重复这条被别的公司走过无数次的老路。Salesforce.com作为CRM系统的专业提供商,对这个领域有着精深的理解。同时,它能够将已经完成的CRM应用模块打包,供用户选择。用户只需要如同在超市选购商品一样选择自己需要的功能模块,让Salesforce.com进行定制集成,一个属于自己的CRM系统就完成了,系统的上线和维护也将由Salesforce.com的专业团队负责。这样,一家非IT公司就可以专注于它的主营业务,使IT真正成为公司的支撑,而不是拖累。

  在案例四中,IBM公司分布在世界各地的9所研究院虽然各自拥有强大的IT基础设施,但有时单个科学实验对资源的需求超出了其所在研究院具有的资源规模,而且以往各自分割独立的组织方式很难让各个机构间协作完成一项工作。实际上,蓝色巨人IBM一直在努力整合自己的IT资源,以降低运营成本。早在2007年,IBM公司就开始着手将运行在3900台服务器上的业务迁移到30台大型机上,从而减少了80%的电力消耗,同时也促进了公司业务的整合。IBM Research Compute Cloud(RC2)的建立把分散于各地的资源从物理和逻辑上整合在一起,为研究院的科研提供了一个近乎取之不尽的资源池。此外,计算资源的整合带动了业务的整合,研究员们可以在IBM RC2上共享实验所需的工具、平台甚至是结果,大大加速了科研的进程。值得注意的是,与前三个案例不同,IBM RC2是供IBM公司内部使用的私有系统,而不是一个为公司以外的用户提供服务的第三方公用平台。

  通过以上四个典型案例,相信读者已经初步领略到了云计算的魅力和价值。是的,云计算就是一种更加智慧的信息技术,它化繁为简、化难为易、化不可能为可能。

  本文摘自《虚拟化与云计算》一书第一章

  1.1.2云计算的定义

  1. 云计算的来源

  在云计算最早被提出的时候,曾经有一种流行的说法来解释“云计算”为何被称为“云”计算:在互联网技术刚刚兴起的时候,人们画图时习惯用一朵云来表示互联网,因此在选择一个名词来表示这种基于互联网的新一代计算方式的时候就选择了“云计算”这个名词。虽然这个解释非常有趣和浪漫,但是却容易让人们陷入云里雾中,不得其正解。

  进入互联网时代后,人们热衷于上网冲浪,通过浏览网页来获得资讯。当用户在浏览器上输入网址后,浏览器将会与DNS服务器和网站服务器进行一系列的交互,将网页内容呈现在用户面前,而这些交互过程是通过互联网经过多次路由转发最终完成的。因为这个过程对用户是透明的,所以当时人们在绘制互联网示意图时,将网络抽象成一朵云,意在不去关心网络的转发过程,而去关注服务器端和客户端,如图1.1左侧所示。

  图1.1 云计算中的“云”

  随着互联网的发展,带宽得到了显著提高,无线接入方式也变得丰富起来,除了个人电脑外,越来越多的设备已经具有了接入互联网的能力,比如移动电话、办公设备甚至是家用电器。同样,互联网的作用也不再局限于浏览网页和收发电子邮件,还能够为企业提供诸如电子商务、客户关系管理等信息服务;为普通用户提供诸如博客、视频等服务;为科研机构提供强大的计算处理能力。因此,互联网的含义变得充实起来,除了人们普遍认知的接入、路由等含义,还包括了计算、存储、服务和软件等元素。因此,“云计算”这个名词就应运而生了。从图1.1右侧我们可以看出,云计算中的“云”不仅包含了网络,更包含了那些曾经被描绘在云外的事物。这个小小的改变在图上看似简单,实际上蕴含着深刻的变革。

  正如用云描绘网络来强调对网络的运用而非关注于其实现细节一样,云计算用云描绘包括网络、计算、存储等在内的信息服务基础设施,以及包括操作系统、应用平台、Web服务等在内的软件,就是为了强调对这些资源的运用,而不是它们的实现细节。

  2. 什么是云计算

  了解了云计算为什么被称之为“云”之后,下面我们将给出云计算的定义。其实,这个概念被提出的时间并不长,然而对这个概念的定义却是百家争鸣。这体现了云计算包罗万象的特质,也说明业界对它的重视——既然所有人都希望成为云计算产业链中的一个角色,自然都会从自身的角度出发来定义云计算,那么对于概念的提取就是一个求同存异的过程。下面,我们先列举一些为人们普遍认可的云计算定义,然后再给出本书的定义。

  在维基百科(Wikipedia.org)中,截止2010年7月,“云计算”的词条被表述为是一种基于互联网的计算,在其中共享的资源、软件和信息以一种按需的方式提供给计算机和设备,就如同日常生活中的电网一样。

  专业的IT名词百科Whatis.com援引来自SearchCloudComputing.com的定义,广义地将云计算解释为一切能够通过互联网提供的服务,这些服务被划分为三个层次:基础设施即服务(Infrastructure-as-a-Service, IaaS)、平台即服务(Platform-as-a-Service, Paas)和软件即服务(Software-as-a-Service, SaaS)。

  在美国加州大学伯克利分校(UC Berkeley)发表的一篇关于云计算的报告中,云计算既指在互联网上以服务形式提供的应用,也指在数据中心里提供这些服务的硬件和软件,而这些数据中心里的硬件和软件则被称为云。

  《商业周刊》(BussinessWeek.com)发表文章指出,Google的云就是由网络连接起来的几十万甚至上百万台的廉价计算机,这些大规模的计算机集群每天都处理着来自互联网的海量检索数据和搜索业务请求。《商业周刊》在另一篇文章中总结说,从Amazon的角度看,云计算就是在一个大规模的系统环境中,不同的系统之间相互提供服务,软件都是以服务的方式运行,当所有这些系统相互协作,并在互联网上提供服务时,这些系统的总体就成为了云。

  Salesforce.com认为云计算是一种更友好的业务运行模式。在这种模式中,用户的应用程序运行在共享的数据中心中,用户只需要通过登录和个性化定制就可以使用这些数据中心的应用程序。

  IBM认为云计算是一种革新的信息技术与商业服务的消费与交付模式。在这种模式中,用户可以采用按需的自助模式,通过访问无处不在的网络,获得来自于与地理无关的资源池中被快速分配的资源,并按实际使用情况付费。本书沿用IBM的定义。这种模式的主体是所有连接着互联网的实体,他们可以是人、设备或程序。这种模式的客体是服务本身,包括我们现在接触到的,以及会在不远的将来出现的各种信息与商业服务。这种模式的核心原则是:

  硬件和软件都是资源并被封装为服务,用户可以通过网络按需地访问和使用。

  在云计算中,IT业务通常运行在远程的分布式系统上,而不是在本地计算机或者单个服务器上。这个分布式系统由互联网相互连接,通过开放的技术和标准把硬件和软件抽象为动态可扩展、可配置的资源,并对外以服务的形式提供给用户。该系统允许用户通过互联网访问这些服务,并获取资源。服务接口将资源在逻辑上以整合实体的形式呈现,隐蔽其中的实现细节。该系统中业务的创建、发布、执行和管理都可以在网络上进行,而用户只需要按资源的使用量或者业务规模付费。

  3. 云计算的特征

  在云计算的定义中,有四个关键要素,如图1.2所示。

  (1)

  硬件和软件都是资源,通过网络以服务的方式提供给用户。正如上一小节所描述的,Amazon EC2将计算处理能力打包为资源提供给用户;Google App Engine将从设计开发到部署实施Web应用所需的软件、硬件平台一起打包提供给用户;Salesforce.com将专业的客户关系管理应用模块打包成解决方案提供给用户。在云计算中,资源已经不限定在诸如处理器机时、网络带宽等物理范畴,而是扩展到了软件平台、Web服务和应用程序的软件范畴。传统模式下自给自足的IT运用模式,在云计算中已经改变成分工专业、协同配合的运用模式。对于企业和机构而言,他们不再需要规划属于自己的数据中心,也不需要将精力耗费在与自己主营业务无关的IT管理上。相反,他们可以将这些功能放到云中,由专业公司为他们提供不同程度、不同类型的信息服务。对于个人用户而言,也不再需要一次性投入大量费用购买软件,因为云中的服务已提供了他所需要的功能。

  (2)

  这些资源都可以根据需要进行动态扩展和配置。例如在前面的典型案例中,Amazon EC2可以在极短的时间内为华盛顿邮报初始化200台虚拟服务器的资源,并在9小时的任务完成后快速地回收这些资源;Google AppEngine可以满足Giftag的快速增长,不断为其提供更多的存储空间、更高的带宽和更快速的处理能力;Salesforce.com可以为哈根达斯公司在已经成型的CRM系统中动态地添加和删除应用模块,来满足客户不断改进的业务需求。这些例子都体现了云计算可动态扩展和配置的特性。

  (3)

  这些资源在物理上以分布式的共享方式存在,为云中的用户所共享,但最终在逻辑上以单一整体的形式呈现。对于分布式的理解有两个方面。一方面,计算密集型的应用需要并行计算来提高运算效率。例如,一个Web应用是由多个服务器通过集群的方式来实现的,此类的分布式系统,往往是在同一个数据中心中实现的,虽然有较大的规模,由几千甚至上万台计算机组成,但是在地域上仍然相对集中。另一方面,就是地域上的分布式。例如,一款商业应用的服务器可以设在位于纽约的华尔街,但是它的数据备份却由位

  于德州戈壁中的数据中心完成。在上文的典型案例四中,IBM公司在世界范围内共拥有9所研究院,IBM RC2将这些研究院中的数据中心通过企业内部网连接起来,为世界各地的研究员提供服务。作为最终用户,这些研究员们并不知道也不关心某一次科学运算运行在哪个研究院的哪台服务器上,因为云计算中分布式的资源向用户隐藏了实现细节,并最终以单一整体的形式呈现给用户。

  (4)

  用户按需使用云中的资源,按实际使用量付费,而不需要管理它们。例如,华盛顿邮报为尽快完成档案的转换任务,使用了200台虚拟服务器,并为其所获得的1407小时机时支付了144.62美元。虽然华盛顿邮报没有足够的运算处理能力,但是云给了它强大的资源来快速完成任务,而它仅需要根据实际使用量来付费。对于华盛顿邮报来说,如此巨大计算量的任务并不经常出现,因此按照这个标准购置IT设备显然是不合理的。如果没有Amazon EC2,华盛顿邮报在9小时内完成档案的转换工作将是不可能的。同样,在Giftag的例子中,Giftag需要做的仅仅是根据其业务的增长而使用更多的Google App Engine的资源。依托Google强大的数据中心,Giftag拥有近乎无限的资源来满足新用户的注册,从而避免了自己投资IT基础设施而可能出现的浪费现象或客户流失。

  总之,在云计算中软、硬件资源以分布式共享的形式存在,可以被动态地扩展和配置,最终以服务的形式提供给用户。用户按需使用云中的资源,不需要管理,只需按实际使用量付费。这些特征决定了云计算区别于自给自足的传统IT运用模式,必将引领信息产业发展的新浪潮。

  1.1.3 云计算的分类

  以上我们分析了云计算中“云”的含义,给出了云计算的例子和定义,并总结了云计算的关键特征。在云计算中,硬件和软件都被抽象为资源并被封装为服务,向云外提供;用户以互联网为主要接入方式,获取云中提供的服务。细心的读者可能已经发现,本章开始给出的四个案例之间既有共同点又存在着差别。相同点是,用户都获取了云中的服务,快速、高效地完成了工作;不同点是,用户获取的服务类型不尽相同。下面我们分别从云计算提供的服务类型和服务方式的角度出发,为云计算分类。

  1. 按服务类型分类

  所谓云计算的服务类型,就是指为用户提供什么样的服务;通过这样的服务,用户可以获得什么样的资源,以及用户该如何去使用这样的服务。目前业界普遍认为,云计算可以按照服务类型分为以下三类,如图1.3所示。

  基础设施云(Infrastructure Cloud)。例如在上文案例一中提到的AmazonEC2。这种云为用户提供的是底层的、接近于直接操作硬件资源的服务接口。通过调用这些接口,用户可以直接获得计算资源、存储资源和网络资源,而且非常自由灵活,几乎不受逻辑上的限制。但是,用户需要进行大量的工作来设计和实现自己的应用,因为基础设施云除了为用户提供计算和存储等基础功能外,不做进一步任何应用类型的假设。

  图1.3 云计算的服务类型

  平台云(Platform Cloud)。例如在上文案例二中提到的Google AppEngine。这种云为用户提供一个托管平台,用户可以将他们所开发和运营的应用托管到云平台中。但是,这个应用的开发和部署必须遵守该平台特定的规则和限制,如语言、编程框架、数据存储模型等。通常,能够在该平台上运行的应用类型也会受到一定的限制,比如Google App Engine主要为Web应用提供运行环境。但是,一旦客户的应用被开发和部署完成,所涉及的其他管理工作,如动态资源调整等,都将由该平台层负责。

  应用云(Application Cloud)。例如在上文案例三中提到的Salesforce.com。这种云为用户提供可以为其直接所用的应用,这些应用一般是基于浏览器的,针对某一项特定的功能。应用云最容易被用户使用,因为它们都是开发完成的软件,只需要进行一些定制就可以交付。但是,它们也是灵活性最低的,因为一种应用云只针对一种特定的功能,无法提供其他功能的应用。

  表1.1总结了从服务类型的角度来划分的云计算类型。实际上,正如我们现在所熟悉的软件架构范式,自底向上依次为计算机硬件—操作系统—中间件—应用一样,这种云计算的分类也暗含了相似的层次关系。这里不同类型的云其实就是云的不同层次提供的云计算服务,我们将在第4章从技术的角度详细分析云计算的层次架构,给出每一层次的主要功能和实现示例。

  表1.1  按服务类型划分云计算

  分类 服务类型 运用的灵活性 用户使用的难易程度

  基础设施云 接近原始的计算存储能力 高 难

  平台云 应用的托管环境 中 中

  应用云 特定功能的应用 低 易

  2. 按服务方式分类

  云计算作为一种革新性的计算模式,虽然具有许多现有模式所不具备的优势(云计算带来的优势将在下文具体分析),但是也不可否认地带来了一系列挑战,不论是从商业模式上还是从技术上。首先就是安全问题,对于那些对数据安全要求很高的企业(如银行、保险、贸易、军事等)来说,客户信息是最宝贵的财富,一旦被人窃取或损坏,后果将不堪设想。其次就是可靠性的问题,例如银行希望每一笔交易都能快速、准确地完成,因为准确的数据记录和可靠的信息传输是让用户满意的必要条件。还有就是监管问题,有的企业希望自己的IT部门完全被公司所掌握,不受外界的干扰和控制。虽然云计算可以通过系统隔离和安全保护措施为用户提供有保障的数据安全,通过服务质量管理来为用户提供可靠的服务,但是仍有可能不能满足用户的所有需求。

  针对这一系列问题,业界按照云计算提供者与使用者的所属关系为划分标准,将云计算分为三类,即公有云、私有云和混合云,如图1.4所示。用户可以根据需求选择适合自己的云计算模式。

  图1.4 云计算的服务方式

  公有云(Public Cloud)。公有云是由若干企业和用户共同使用的云环境,IT业务和功能以服务的方式,通过互联网来为广泛的外部用户提供;用户无需具备针对该服务在技术层面的知识,无需雇佣相关的技术专家,无需拥有或管理所需的IT基础设施。我们上文所举的Amazon EC2、Google AppEngine和Salesforce.com都属于公有云的范畴。在公有云中,用户所需的服务由一个独立的、第三方云提供商提供。该云提供商也同时为其他用户服务,这些用户共享这个云提供商所拥有的资源。

  私有云(Private Cloud)。私有云是由某个企业独立构建和使用的云环境,IT能力通过企业内部网,在防火墙内以服务的形式为企业内部用户提供;私有云的所有者不与其他企业或组织共享任何资源,例如我们上文所举的IBM RC2。私有云是企业或组织所专有的云计算环境。在其中,用户是这个企业或组织的内部成员,他们共享着该云计算环境所提供的所有资源,公司或组织以外的用户无法访问这个云计算环境提供的服务。

  混合云(Hybird Cloud)。混合云是整合了公有云与私有云所提供服务的云环境。用户根据自身因素和业务需求选择合适的整合方式,制订其使用混合云的规则和策略。在这里,自身因素是指用户本身所面临的限制与约束,如信息安全的要求、任务的关键程度和现有基础设施的情况等,而业务需求是指用户期望从云环境中所获得的服务类型。有研究表明,例如网络会议、帮助与培训系统这样的服务适于从公有云中获得;例如数据仓库、分析与决策系统这样的服务适于从私有云中获得。

  一般来说,对安全性、可靠性及IT可监控性要求高的公司或组织,如金融机构、政府机关、大型企业等,是私有云的潜在使用者。因为他们已经拥有了规模庞大的IT基础设施,因此只需进行少量的投资,将自己的IT系统升级,就可以拥有云计算带来的灵活与高效,同时有效地避免使用公有云可能带来的负面影响。除此之外,他们也可以选择混合云,将一些对安全性和可靠性需求相对较低的日常事务性的支撑性应用部署在公有云上,来减轻对自身IT基础设施的负担。相关分析指出,一般中小型企业和创业公司将选择公有云,而金融机构、政府机关和大型企业则更倾向于选择私有云或混合云。

  值得注意的是,虽然私有云能够为企业或组织创建一个独占的云环境,具有防火墙内的信息安全保障,提供资源与服务共享的便利,但是拥有与运维一个私有云需要较高的资金投入与持续的技术支持,即便是实力雄厚的公司也会力不从心。同样,虽然公有云能够为用户快速而便捷地提供IT能力,但是有些企业和组织希望能够获得更强的私密性,因此,在现实的生产环境中,云的私有性和公有性并不是泾渭分明的,而是存在着多种逐级过渡的方案,如图1.5所示。

  除了完全由自己拥有和运维的私有云外,用户还可以选择“被管理的私有云”和“被托管的私有云”两种提供模式。在被管理的私有云中,承载云环境的IT设备和基础设施仍由所属的企业或组织拥有,在物理上位于企业的数据中心内,但其私有云的创建和运维将由专业的第三方公司来完成。一般来说,这样的第三方公司常常会通过以下步骤来帮助客户完成私有云的搭建:第一,将客户现有的物理资源通过虚拟化技术进行逻辑化,形成便于划分的资源池;第二,在该逻辑资源池上创建业务应用,并订立服务目录以便使用者浏览;第三,为业务应用提供自助访问接口和用量计费功能,服务上线并为私有云所属的企业或组织内用户所用。此后,该第三方公司还将为客户持续地提供在运维上的支持,如安全管理、业务升级、新服务上线等。

  与被管理的私有云相同,被托管的私有云的创建与运维将由第三方公司来完成。相比前者更进一步,如果客户选择后者作为自己拥有私有云的模式,它将不再需要建设自己的数据中心,云环境所需的IT设备和基础设施将被托管在由第三方公司提供的专业数据中心内,并可根据合同的订立来保证客户在该数据中心内对资源在物理上或逻辑上的独占性。这种独占性是该模式与公有云的本质区别。在公有云中,不同客户需通过多租户(Multi-Tenancy)技术来共享底层资源,有关该技术细节将在第5章中介绍。

  同样,用户对于公有云的选择还可以分为排他的公有云和开放的公有云两种。在排他云中,云服务的提供者和使用者不是同一个企业,但它们事先知道谁会提供何种服务,谁会使用何种服务,它们通过线下的协商确定服务价格和服务质量。排他云通常出现在企业的联盟中,例如:某大企业与它的众多供应商和业务伙伴间可以建立排他云,大企业为供应商们提供云服务;某一行业联盟中的企业间可以建立排他云,比如:航空公司、酒店、旅行社等组成的联盟。

  在开放的公有云中,服务的使用者和提供者在服务预订前彼此不知晓对方,他们的关系是通过在线服务订阅的方式确立的。服务条款通常是由服务提供方预先定义和控制的,而服务价格和服务质量约定也是自动的和标准化的,由服务提供方预先设定。

  综上,从私有云到公有云,第三方公司能够为客户提供不同深度的自底向上的整合服务,帮助用户便捷可靠地获得私有云,同时有效减轻其建设数据中心、购置基础设施和运维云环境的负担。

  1.1.4 相关概念辨析

  在计算机科学技术发展的历史上,曾经出现过一些里程碑式的技术。这些技术产生的时间或远或近,但都对当今世界的IT运用模式产生了巨大的影响。这些技术包括并行计算、网格计算和效用计算。罗马不是一天建成的,同样,云计算也不是一蹴而就的,而是从这些技术中逐渐演进而来,既一脉相承,又有所不同。下面我们就来辨析云计算与这些相关概念的异同。

  1. 并行计算

  并行计算(Parallel Computing)将一个科学计算问题分解为多个小的计算任务,并将这些小任务在并行计算机上同时执行,利用并行处理的方式达到快速解决复杂运算问题的目的。并行计算一般应用于诸如军事、能源勘探、生物、医疗等对计算性能要求极高的领域,因此也被称为高性能计算(High Performance Computing)或超级计算(Super Computing)。并行计算机是一群同构处理单元的集合,这些处理单元通过通信和协作来更快地解决大规模计算问题。常见的并行计算机系统结构包括共享存储的对称多处理器(SMP)、分布式存储的大规模并行机(MPP)和松散耦合的分布式工作站集群(COW)等。解决计算问题的并行程序往往需要特殊的算法,编写并行程序需要考虑很多问题之外的因素,例如各个并发执行的进程之间如何协调运行、任务如何分配到各个进程上运行等。

  并行计算机可以说是云环境的重要组成部分,例如案例四中IBM研究院科研人员使用的IBM RC2。与云计算的思想相似,目前世界各国已经集中建立了若干超级计算中心来服务于该区域内有并行计算需求的用户,并采用分担成本的方式进行付费。但是,云计算与传统意义上的并行计算相比,又存在明显的区别。首先,并行计算需要采用特定的编程范例来执行单个大型计算任务或者运行某些特定应用,而云计算需要考虑的是如何为数以千万计的不同种类应用提供高质量的服务环境,以及如何提高这个环境对用户需求的响应从而加速业务创新。一般来说,云计算对用户的编程模型和应用类型等没有特殊限定,用户不再需要开发复杂的程序,就可以把他们的各类企业和个人应用迁移到云计算环境中。其次,在并行计算中,计算资源往往集中在单个数据中心的若干台机器或者集群上。云计算则更加强调用户通过互联网使用云服务,并在云中利用虚拟化进行大规模的系统资源抽象和管理。云计算中资源的分布更加广泛,正如上文所述,它已经不再局限于某个数据中心,而是扩展到了多个不同的地理位置。同时,由于采用了虚拟化技术,云计算中的资源利用率可以得到有效的提升。由此可见,云计算是互联网技术和信息产业蓬勃发展背景下的产物,完成了从传统的、面向任务的单一计算模式向现代的、面向服务的多元计算模式的转变。

  2. 网格计算

  网格计算(Grid Computing)是一种分布式计算模式。网格计算技术将分散在网络中的空闲服务器、存储系统和网络连接在一起,形成一个整合系统,为用户提供功能强大的计算及存储能力来处理特定的任务。对于使用网格的最终用户或应用程序来说,网格看起来就像是一个拥有超强性能的虚拟计算机。网格计算的本质在于以高效的方式来管理各种加入了该分布式系统的异构松耦合资源,并通过任务调度来协调这些资源合作完成一项特定的计算任务。

  可见,网格计算着重于管理通过网络连接起来的异构资源,并保证这些资源能够充分为计算任务服务。通常,用户需要基于某个网格的框架来构建自己的网格系统,并对其进行管理,执行计算任务。而云计算则不同,用户只需要使用云中的资源,不需要关注系统资源的管理和整合。这一切都将由云提供者进行处理,用户看到的是一个逻辑上单一的整体。因此,在资源的所属关系上存在着较大差异,也可以说在网格计算中是多个零散资源为单个任务提供运行环境,而在云计算中是单个整合资源为多个用户提供服务。

  3. 效用计算

  效用计算(Utility Computing)强调的是IT资源,如计算和存储等,能够根据用户的要求被按需地提供,而且用户只需要按照实际使用情况付费。效用计算的目标是IT资源能够像传统公共设施(如水和电等)一样的供应和收费。效用计算使得企业和个人不再需要一次性的巨额投入就可以拥有计算资源,而且能够降低使用和管理这些资源的成本。效用计算追求的是提高资源的有效利用率,最大程度地降低资源的使用成本和提高资源使用的灵活性。

  效用计算所提倡的资源按需供应、用户按使用量付费的理念与云计算中的资源使用理念相符。云计算也可以按照用户的资源需求分配运算、存储、网络等各种基础资源。比效用计算更进一步的是,云计算已经有了很多实际应用案例,所涉及的技术和架构可行性更强。云计算所关注的是如何在互联网时代以其自身为平台开发、运行和管理不同的服务。云计算不但注重基础资源的提供,而且注重服务的提供。在云计算环境中,不但硬件等IT基础资源能够以服务的形式来提供,应用的开发、运行和管理也是以服务的形式提供的,应用本身也可以采用服务的形式来提供。因此,云计算与效用计算相比,技术和理念所涵盖的范围更广泛、可行性更强。

  4. 物联网

  物联网(Internet of Things,IoT)是一个将人,物理实体和信息系统互联起来的遍布全球的系统。它通过可扩展、价格可以接受的技术,如大范围的数据搜集、智能网络、预测分析和深度优化等,来更好地管理物理世界。物联网是当前重要的创新领域。国务院总理温家宝2009年11月3日在人民大会堂向首都科技界发表题为《让科技引领中国可持续发展》的讲话中明确指出:信息网络产业是世界经济复苏的重要驱动力。全球互联网正在向下一代升级,传感网和物联网方兴未艾。温总理的讲话将物联网提升到国家战略的高度,物联网的应用也日趋丰富,如高速公路不停车收费系统、公路铁路车辆调度系统、物流货品追踪管理、学生进出校门管理,手机移动支付系统等,都是基于物联网理论的应用探索。

  物联网的核心和基础在于物品与物品之间的互联。相对于传统的互联网,物联网将计算机间的互联互通延伸和扩展到物与物之间。云计算与物联网在概念上有很强的关联性。我们可以将物联网看作是处于前端的传感器与网络设备、处于核心的云计算海量数据处理平台和处于上层的应用系统这三者的结合体。云计算作为物联网数据处理的核心平台,适于处理物联网中地域分散、数据海量、动态性和虚拟性强的应用场景。它能够促进物联网底层传感数据的共享,为分析与优化提供超级计算能力,从而更高效地提供更可靠的服务。如果将物联网比喻为人体,那么传感器就如同感知器官,网络就如同神经系统,云计算就如同大脑。传感器所获得的物理世界的信息通过网络汇聚到云中,通过云计算提供的处理、存储和共享能力,进行有针对性的调优,再通过一定的反馈机制作用于物理世界,使其更加智慧而有效地运行。可见,物联网与云计算是相辅相成的概念。云计算为物联网提供了使其发挥效用的核心能力,物联网为云计算提供了宽广而前景光明的舞台。

1
相关文章