云计算 频道

不学谷歌 浪潮建设公有云的四个新思维

      【IT168 评论】谈到云计算领域里的公有云,大家往往会先想到谷歌、亚马逊等,国内也有一些企业在向它们学习,构建类似的云计算服务平台。然而,谷歌的模式是唯一的方法吗?是否还存在另外一条甚至多条建设公有云的道路?

  日前,浪潮在其云计算战略发布会上[专题],提出了建设中国公有云的新思路:首次定义“行业云”,并认为行业云将是未来我国云计算的主要形态,区别于谷歌为代表的公众云模式。浪潮还详细分析了行业云数据中心对包括服务器、存储、系统软件在内的软硬件基础架构的需求挑战,提出了用大服务器和海量存储打造云计算硬件核心,构建新型云计算中心操作系统等具体对策。

  新思维1:行业云是公有云发展的新形式

  对云计算模式的划分,一般可分为公有云、私有云和混合云。业界关于哪一种模式最有商业前景的争论也是此起彼伏,非常激烈[参见:谁将胜出?私有云与公有云激辩十回合]。

  此次浪潮提出“行业云”概念,可谓帮公有云阵营增添了一个砝码,也引发业界对于云计算发展前景的新一轮思考。

  根据浪潮的定义,所谓“行业云”,是由行业内或某个区域内起主导作用或者掌握关键资源的组织建立和维护,以公开或者半公开的方式,向行业内部或相关组织和公众提供有偿或无偿服务的云平台,因此,行业云也是一种公有云,但区别于谷歌、亚马逊那样的“公众云”。

新思维1:行业云是公有云发展的新形式
▲浪潮集团高级副总裁王恩东在解释“行业云”

  其实,在笔者看来,这类行业云的雏形已经在市场上出现,比如北京市计算中心正在搭建的“北京云”,主要是为北京地区的企业提供包括设计、模拟在内的高性能计算服务;IBM在无锡软件园搭建的软件测试云,帮助园区内软件企业快速搭起测试环境,加快软件开发速度。可见,这些模式既不是类似谷歌、亚马逊那样面向全世界人民开放的公众云,也不是某个企业内部的私有云,而是由某个行业或区域性组织建立的为有限用户或普通公众提供服务的平台。

  浪潮此番还给出了行业云与公众云的具体区别。浪潮认为,按照数据获取路径和数据是否具有私密性,公有云可以继续细分为公众云和行业云,前者是数据来源和服务对象都是公开的公众,例如Google,而后者数据具有私密性,但是服务对象却是公开的,如环境卫星资源数据中心、政务系统、经济/人口统计数据服务等。从服务对象的数量来看,行业云也是介于公众云和私有云之间。企业私有云服务的规模为几千人、几万人,象Google这样的公众云服务几十亿人,而行业云服务对象的规模介于两者之间,可能是某省市关心该行业、该领域的几十万人、几百万人,也可能是全国关心某行业、某领域的几千万甚至上亿人。

  谈到建设行业云的必要性,浪潮集团高级副总裁王恩东告诉IT168记者,“当前行业信息化还是以内部服务为主,只是解决办公效率的问题,而对社会、对大众提供的信息服务几乎是空白,核心的有价值的数据大部分掌握在各个行业、各个垂直的部门中,把这些数据进行挖掘、及时提供服务是行业信息化的必然趋势。因此,行业云将逐步成为云计算的主要形态。”

  他指出,建设行业云的主导单位是各地政府机构或行业、区域性组织,如某省市的卫生局联合下属医疗机构合建“医疗云”,某省市交通局联合公交公司、运输公司等合建“交通云”,进而为公众提供数据服务。

  新思维2:行业云将推动数据服务应用大发展

  如果说亚马逊提供的是计算和存储资源服务,微软Windows Azure提供的是软件开发和部署服务,用友伟库网等SaaS厂商提供的是在线应用软件服务,那么,浪潮所倡导的“行业云”将主要提供什么样的服务呢?

  对此,浪潮系统软件总监兼云计算产品研发部总经理张东谈到,建设行业云最关键的问题是如何将数据活化,将数据转化为服务。“虽然各个行业过去十几年里也建设了很多信息化系统,但这些系统都是封闭的,行业云的功能就在于实现从数据到服务的转化。”

新思维2:行业云将推动数据服务发展
▲浪潮系统软件总监兼云计算产品研发部总经理张东

  他举了这样几个例子,比如,在环境监控中,通过卫星遥感收集到的水、森林、土地等相在的海量数据,经过分析处理,可以得出土地利用率、自然灾害预警等信息,进而提供给政府部门决策使用。在数字化医疗中,病人所有的健康信息都存在一张卡中,只要刷一下,以往的病历、体检记录、在不同医院的检查结果都可以呈现在医生的电脑中,从而帮助医生做出更全面的诊断。又比如在食品卫生监控中,如果在食品生产、加工、运输、销售过程中各个环节的数据都公开、透明,食品安全就可以得到很大的保障。此外,像交通、远程教育、工商、税务、质监等行业,其公众服务都可以通过云计算来实现,进而对国家决策、政府运作、行业监管、企业发展等都具有重要意义。

  其实,笔者也注意到,谷歌一直在拓展自己的云服务范畴,除了大家熟知的搜索服务、Google App Engine等之外,它也在开始提供针对某行业或区域的数据分析服务。比如,谷歌的公共数据管理器(Public Data Explorer),它可以让海量的数据表变得可视化、更加生动和易于沟通使用。目前谷歌所使用的数据库来自多个途径,包括世界银行、美国经济分析统计局、欧盟统计局、澳大利亚统计局、美国劳工统计局、美国人口统计局、能源信息管理局、加州教育局等。下面我们举两个例子来看一下:

  比如,下面这个Flash动画呈现了1969年-2007年美国加州数十个县市人均收入的变化情况。从中可见,1969年,这些县市之间的人均收入差距并不大,最高的加州Marin 郡是人均收入5811美元,最低的Yuba县是3139美元,前者是后者的1.85倍,但近四十年之后,加州Marin郡人均收入仍然最高,达到91483美元,而最低是Kings县,为23418美元,前者是后者的3.9倍。这一动画让几十个县市在过去几十年间的人均收入变化非常清晰地呈现了出来,如果再配以其他经济指标,这无疑对于政府决策和经济形势研判会带来非常大的便利。

  又比如,下面这个动画通过对来自世界银行的数据进行分析,展现了是世界不同地区在1960年-2008年间人口总量、每个女人所生婴儿数量及人的平均寿命的变化情况。

  如果你有兴趣了解其他统计结果,如欧洲消费物价指数、世界发展指数、欧洲最低工资、欧洲政府债务、美国GDP和个人收入、美国零售收入、美国人口、美国性病传播、美国人口死亡率、美国癌症案例、美国温室气体排放、天然气价格等信息,还可以访问谷歌公共数据管理器直接点击查看:http://www.google.com/publicdata/directory

  对比分析来看,笔者认为,浪潮所描绘的“行业云”要提供的数据挖掘和分析服务,与目前的谷歌公共数据管理器有很大的类似之处。不同的是,前者所用的数据是有一定私密性的,不象公众云那样是大家可以随便公开分享,一般不能轻易获得,如医疗信息掌握在医院手中,食品安全信息掌握在质监部门手中,而后者所用的数据是广泛公开的,前者服务的对象可能更有针对性,可能会收费,后者面向的是普通公众,完全免费。

  张东也指出,“对行业云而言,数据未来就是第一生产力,谁掌握了数据,谁就可以推动整个行业的发展。”他还谈到,要让这些行业数据变成信息,并转化成服务提供出去,用类似谷歌的公众云模式是不完全可行的,比如谷歌虽然也在试图做一些针对关键数据的服务,但实际上遭到了各国政府的反对。

  新思维3:云计算不是服务器农场,大服务器是核心

  云计算的发展离不开数据中心基础架构的支撑,行业云也不例外。

  不过,浪潮认为,不同于谷歌、亚马逊等公众云服务供应商大量使用低端服务器来构建“服务器农场”的做法,在行业云数据中心里,虽然通用平台仍会大规模使用低成本的高密度服务器,但核心却是8路以上的“大服务器”。

新思维3:大服务器才是云计算核心
▲一台谷歌定制的服务器

新思维3:大服务器才是云计算核心
▲浪潮正在研制中的8-32路大服务器

  早在今年6月份,浪潮集团高级副总裁王恩东就曾撰文指出,云计算后台用海量的低端服务器做计算中心,其实是无奈之举,也不适合所有的云计算应用。

  从计算技术上看,“服务器农场”只适合分布式计算,比如谷歌,它提供的是搜索、新闻等类型的服务,这些服务依赖的都是一些分散数据,没什么关联性,可以分布到多个地点和设备上进行存储,计算也可以拆分成多个任务由上千台的低端服务器一起完成。但是在未来,面向一些关联性很强的数据和运算,例如OLTP业务(联机事务处理),才是更为广泛的商业计算模式,而分布式技术受制于数据同步问题,在这种应用上就很困难。比如银行的业务系统,其业务数据是强耦合的关系型数据,必须建立统一的数据库系统,这也是为什么银行一直是大服务器的忠实客户。未来将会有越来越多的OLTP业务迁移到云计算中,发展面向OLTP的云计算业务会成为重要趋势。

  其次,即便是在分布式云计算平台中,“服务器农场”也只是一种过渡阶段。随着云计算应用的成熟和深入,应用和数据的跨数量级整合是一个大趋势,对服务器的性能、可靠性、扩展性等几乎是永无止境的需求,集中规模的累积必然会使得云计算物理平台发生质变,就好比现在电力行业小型发电机被大型发电机组取代一样,分散的、过渡的模式将被逐步取代,大型服务器将成为云计算硬件基础的核心。

  在此次云计算战略发布会上,张东则进一步从行业云数据中心的应用需求出发,详细阐述了为什么大服务器才是云计算,尤其是行业云计算数据中心里的硬核?他指出,从需求特征来看,对行业云的技术要求体现在“高效率、大规模、高可用、易管理、低耗节能、安全”几个方面:

  首先,由于行业数据非常庞大,而且对于数据处理的时效性要求很高,因此要求行业云里要有强大、高效的大规模数据存储和处理能力。

  其次,由于行业云要对外提供服务,对服务质量的要求非常高,因此对行业云的高可用性要求也很高,要达到99.999%,也就是每年的服务中断不能超过5分钟。

  再次,由于行业云数据中心非常庞大,涉及几千上万台计算机、存储和网络设备,因此对易管理的要求也很高,比如要有集中管理、远程管理等,以降低管理成本。

  第四,大规模数据中心的能耗问题也很突出,因此要求数据中心采取低耗节能的技术。

  最后,安全是永恒的话题,把所有的数据放到网上,如何保护这些数据的安全,如何保证个人数据的隐私,以及这些数据的完整性,都是非常重要的课题。

  基于上述六个方面的需求分析,张东指出,行业云数据中心里的核心硬件设备非高端服务器和海量存储莫属,因为只有这样的基础硬件才能满足“高性能、高可靠、易管理、易拓展”的要求。

  首先,从数据处理能力来看,行业云需要更多更复杂、关联性极强的结构化数据和大量的非结构化数据,需要计算机系统的多线程并发、紧耦合共享内存技术的支撑。比较来看,公众云服务如搜索、共享等,数据之间的相关性是比较低的,比如搜索一个网页和另一个网页,不需要做关联检查,因此很多厂商采用低廉的服务器。但在行业云中,很多核心应用的数据关联性非常复杂,低端服务器就不适用了。另外,在大规模数据处理中,I/O瓶颈问题一直很突出,因此需要大共享内存、高内部互联的“胖节点”来支撑。比如,浪潮曾经测试过,对于数据库应用,16台低端服务器集群的处理能力还不如一台8路高端服务器。

  其次,从系统可用性方面看,行业云数据中心为了提供连续稳定的服务,往往需要99.999%以上的可用性,因此需要计算机系统的容错技术和高可用技术的支撑。采用低端服务器集群,虽然通过冗余方式也可以提高可用性,但要达到99.999%至少需要3路冗余,设备利用率非常低。而且,如果采用备份-恢复方式恢复系统,系统恢复时间要长达几分钟,也无法满足应用服务99.999%的要求。从管理的角度看,就算1台服务器的MTBF是三年,那1000台服务器加在一起的MTBF也就1天,即每天都有设备要更换,系统管理维护的难度可想而知。

  第三,从系统高密度、低能耗、易管理角度看,大规模数据中心的占地和能耗越来越大,需要硬件设备单位性能占用更小的体积,消耗更少的能源;同时大规模数据中心的管理和维护难度及成本逐步提高,需要系统提供智能化、集中式的远程管理技术。这些都使得简单地堆积低成本服务器的方式很难满足要求。

新思维3:大服务器才是云计算核心
▲浪潮的产品路线图

  为此,浪潮已经在布局高端服务器和海量存储设备的研发。在服务器方面,浪潮上半年推出了8路服务器天梭TS850,目前正在研制天梭32路高端服务器。其共同特点是高性能,8-32路紧耦合体系结构,支持1TB以上的物理内存;通过软硬件结合的高可用技术,单台设备的可靠性可以达到99.999%;易拓展,集成硬件分区、虚拟化分区等,可以大大提高设备的利用率;集成带外管理功能,即使在关机情况下也可以对设备进行监控和管理,大大减轻管理数据中心的难度。在海量存储方面,最高容量可以达到1PB,并发带宽非常高,可以实现多路冗余,整体可靠性达到99.999%,同时还支持远程镜像、快照、快速复制等高级功能。

  新思维4:云计算数据中心需要新型“操作系统”

  如果说硬件是基础,那么软件就是灵魂。

  在单台计算机中,我们需要操作系统来协调管理底层硬件资源和服务应用,在一个云计算数据中心里,同样也需要类似“操作系统”的系统软件——实现软硬件资源高效管理和利用、提供持续稳定的大规模数据处理服务,且安全可靠,定位于云计算基础架构供应商的浪潮将其称为“云计算中心操作系统”。

  不过,在浪潮看来,目前的系统软件难以应对云计算环境所带来的诸多挑战,为此,浪潮将自主设计云计算中心操作系统:云海OS。

新思维4:云计算中心需要新操作系统
▲浪潮云海OS架构

  那么,从具体需求应用来分析,云计算中心对系统软件的挑战主要表现在哪些方面呢?张东谈到,主要集中在以下五点:

  1)资源的高效利用:在传统的数据中心环境中,硬件是独立的,一般每台机器上装一个操作系统,每几台机器装一个集群、负载均衡或HA软件,共同运行一个应用,比如这几台运行数据库,那几台运行WEB,还有几台是跑邮件。当这些应用负载增加需要扩展资源时,往往只能增加机器,从而造成了平均利用率很低的局面。据统计,在分布式计算环境中,高达85%的计算资源被闲置,无法实现资源的有效调度,既造成了资源的低效,又造成了成本和能源的浪费。因此,如何提高资源的利用率是云计算数据中心首要解决的问题。

  2)大规模数据处理:目前传统操作系统以文件方式进行数据管理,而一般文件存放在本地或后端集中式存储系统中,因此,在面临大规模数据处理访问时,瓶颈就会非常严重。由于数据供应不上,反过来也会影响计算资源的有效利用率。另外,传统系统软件缺乏标准化和抽象化的分布式数据处理接口,使得应用软件在不同的系统中间迁移非常困难,进而使应用软件的开发效率较低。

  3)持续稳定的服务:采用传统的HA方式,系统可用性很难达到99.999%,而且传统HA方式切换时间较长,也无法完全满足应用软件永远在线的要求。另外,采用集中式存储,数据的可用性无法满足要求,并对数据安全也带来了挑战。

  4)方便易用的管理:没有形成统一的软硬件管理,庞大系统的管理运维困难,成本不断攀升。

  5)资源的安全可靠:传统数据中心租户间的资源是完全隔离的,系统软件没有考虑云计算环境下多租户间资源共享情况下的安全隔离。另外,云计算环境对于数据隐私保护、数据安全、数据完整性的要求都非常高,传统的系统软件也难以应付。

  此外,从产品形态上来讲,云计算中心需要一个“产品化”的操作系统,且与硬件和应用相互独立,而目前有一些云计算中心虽然有系统软件,但却是与硬件、应用捆绑在一起的,缺少独立性。作为产品化的云计算操作系统,其特征表现在:可以单独获得,可以复制、易部署,与硬件与应用有清晰的接口,统一标准和规范,能够支撑多种硬件与应用,采用模块化设计,可以让用户根据需要选择安装不同功能模块。

  正是基于以上的理解,浪潮已经在研制新型的云计算中心操作系统,即“云海OS”,计划在今年四季度发布1.0版本。据张东介绍,浪潮云海OS的主要特征包括:支持异构硬件平台,基于块设备的分布式存储管理,支持资源动态流转,单个数据中心管理计算机数量不少于5000,数据存储容量不少于50PB,总体可用性达到99.99%,支持百万量级虚拟资源与虚拟进程的管理。

  后记:在乱象中寻找出路

  云计算作为一种新的IT商业模式和应用模式,已经得到了广泛关注。据IDC预测,2012年全球云计算市场规模将达420亿美元,相关产业总产值达4520亿美元,未来几年,云计算市场的增长率将在20%以上。

后记:在乱象中寻找出路
▲漫画云计算

  纵观中国云计算产业这两年的发展态势,热闹的背后,却是一片混沌:大大小小的厂商都在往云计算概念上靠,各地方的所谓云计算中心纷纷上马,各种各样的云计算观点满天飞。浪潮集团高级副总裁王恩东在接受采访时也指出,虽然关于云计算的讨论已经持续了近三年,但仍然存在一些乱象,具体表现在:一是IT厂商从自身利益角度出发“各说各话”,出现许多片面化的云计算观点;二是客户对云计算的理解陷入误区,象“瞎子摸象”一样,对整体架构不重视;三是云计算中心建设盲目跟风,人云亦云;四是缺少实际应用,雷声大,雨点小。所以,云计算产业发展首先要理清当前认知混乱的局面,化云为雨,脚踏实地。

  当然,这或许是每个新兴产业在发展前期都要经历的过程。但正因为这样,我们更应该拔开迷雾,看清本质,理清优劣势和发展思路,小到一家企业,大至一个国家,莫不如此。

后记:在乱象中寻找出路
▲根据Gartner,目前云计算仍然处在概念膨胀阶段,离主流应用仍有2-5年

  当前,中国的云计算产业可谓“危”、“机”并存。一方面,中国发展云计算有自己的优势,中国电子学会云计算专家委员会副主任委员倪光南院士在这次发布会上就总结了四点:一是市场基础好,互联网和有线电视网全球先进;二是云计算服务透明化给国产CPU和操作系统提供了产业化机会;三是云计算大大节省硬件设备和电力消耗,符合节约型社会发展需求;四是云计算可以推动我国实现安全、低成本的信息化进程。

  另一方面,中国云计算产业也面临许多问题。科技部高技术研究发展中心信息技术处处长嵇智源就指出,发展云计算不仅是加快结构调整和转变发展方式的重要途径和举措,同时更是提升国家竞争力、抢占新一轮全球竞争制高点的战略选择。但跟欧美日等发达国家比,我国云计算技术起步较晚,而且正呈现“头重脚轻”的发展趋势,即云计算应用种类繁多,但基础核心技术缺失,如果长此以往,就宛如“空中楼阁”,前景不容乐观。国内企业必须要在云计算的核心技术领域实现自主可控,才能在新一轮的信息变革中掌握话语权。

  可见,中国的云计算产业,尤其是公有云的建设,不能总是跟在谷歌、亚马逊后面,要想在弯道中实现超越,必须另辟蹊径,自主创新,“行业云”或许不失为一种选择,但其技术实现、运行机制、商业模式等问题还需要进一步探讨落实。

0
相关文章