云计算 频道

云存储:技术、平台还是服务

  【IT168 资讯】谈到云存储,第一个想到的一定是Amazon,也就是当初那个网上卖图书的亚马逊,.COM的先驱。不知道从什么时候起,亚马逊也开始卖起了存储服务,又成为了云存储服务的先驱。

云存储就在我们身边

  亚马逊提供一种称为弹性计算云(Amazon EC2,Amazon Elastic Compute Cloud)的服务。借助Amazon EC2,用户可创建操作系统、应用程序和配置设置等机器映像;然后上载至亚马逊简单存储服务(Amazon S3,Amazon Simple Storage Service)并注册。Amazon EC2所提供的处理能力可实时增减,少则1台虚拟机,多至1000台以上,总之,由亚马逊提供用户所需要的计算能力,用户按照其计算和所消耗的网络资源来付费。如此一来,用户的信息化应用就转变成为一种购买服务的方式。

  针对EC2,Amazon此后推出了弹性块存储 (EBS,Elastic Block Storage)产品,同时提供存储和计算的能力。Amazon的EC2总经理Peter De Santis说:“我们允许用户独立于实例进行容量配置,从1GB到1TB都可以。”最初,EBS起步价为1GB/月收取10美分,对每100万个存储I /O请求收取10美分。据了解,用户可以将EBS转移到Amazon的S3存储服务上。

  Amazon只是目前提供云存储服务的厂商之一。IBM在2008年4月也推出了云存储的服务,它针对那些拥有2~3个 Windows服务器或者拥有小型数据中心的商业用户。IBM云存储是一种典型的网络数据存储服务,它将数据存储在众多虚拟化服务器当中,提供第三方的支持和服务。通过云存储,IBM为用户提供远程的数据保护以及邮件管理服务。

  此前有消息透露,微软也有可能将发布一款基于Web的服务,可以使用户通过手机存储、共享并备份数据,预计这一服务将在运行微软Windows Mobile 6手机操作系统的手机上实现,用户将得到200MB免费存储空间,我们也可以将其视为一种云存储的服务。

  如果说这些云存储服务都还是局限在国外,距离国内消费者还非常遥远。其实,在我们身边也已经有云存储服务的萌芽。如果有兴趣,可以检索一下“网络存储”,就会看到很多提供服务的厂商。例如PSP玩家所熟悉的“纳米盘”,堪称国内第一款真正意义上的支持外链免费大容量网络硬盘。

  利用纳米盘免费存储,用户可以随时随地访问自己上传的文件,也可以和朋友分享这些文件。由于纳米盘支持图片外链,因此很多用户会使用它与朋友之间分享照片。据悉,纳米盘可以支持的单个文件大小为4GB。它采用专用的上传工具,称为纳米机器人。在网上,可以看到很多诸如此类的网络硬盘服务,如 800Disk、Mofile和猪八戒网盘等,通常服务商都会承诺免费永久存储、海量存储、并支持断点续传等功能,有些服务商还支持没有用户端软件的要求。这些网络硬盘服务,都可以视为一种面向个人的云存储服务。

  不仅是服务商在打云存储的主意,其实微机厂商也在打云存储的主意。2007年,EMC收购了在线备份服务商Mozy。在欧洲,Mozy与联想有一个合作,在其ThinkPad笔记本电脑上捆绑Mozy软件,用户购买ThinkPad笔记本电脑就可以自动获得Mozy所提供的在线备份服务。EMC大中华区总裁叶成辉曾经透露,EMC将2008年收购的另外一家存储服务公司PI与Mozy并成一个独立的公司Decho,专门提供在线信息管理服务,并有望继续与联想合作,将服务引入到中国市场。这也是一种云存储的服务。

  云存储技术架构

  尽管云存储的服务就在我们身边,但是作为技术媒体,我们仍然要问,云存储是怎么构成的?从技术上看,它和存储虚拟化、集群存储以及SAN+NAS等有什么区别和联系?还是要走到云存储看看其结构和组成。

  到目前为止,我们还没有机会走到亚马逊等服务器商的数据中心,了解其结构和组成。我相信也不会有这样的机会。这就像沃尔玛,它是不会告诉你其物流是如何管理的,因为这是他们的商业机密。但是这也并不妨碍我们了解云存储的架构。

  要了解云存储的架构,首先需要明确:什么是云存储?对此,IBM大中华区云计算中心项目总监朱近之指出:云存储不是一个设备,而是一种服务,具体说来,他是把数据存储和访问作为一种服务并通过网络提供给用户。云计算是提供计算能力,相应的,云存储是提供存储能力。

  朱近之表示,与之相比,存储虚拟化也好,还是集群存储、SAN+NAS等都是一种技术,二者之间没有必然的联系。但是从架构上看,云存储会利用到现有的存储技术。例如存储虚拟化,云存储可以借助该技术构建庞大的存储池,屏蔽底层存储差异,从而对外提供一致的服务。

  由此看来,云存储并没有更多技术上的突破,它只是更好利用了现有的存储技术,更好进行了发挥,对外提供统一的存储外包服务。从形式上看,与软件SaaS服务有些类似,所不同的是云存储所提供的存储管理和服务。如果这种服务面向个人,如前面提到的网络硬盘、微软Mobile 6手机Web服务以及EMC Mozy提供在线备份服务等,就可以称为面向个人的云存储服务。由于目前,个人用户对于存储数据的安全性要求,不像企业级用户要求那样高,对于诸如泄密的问题也不是那么敏感,因此面向个人的云存储服务发展会更快一些。

  除了面向个人的云存储服务之外,还有面向企业的云存储服务,对于企业级云存储服务而言,由于数据关系到企业的核心竞争力,因此对于运营商有很高的要求,无论是SLA(服务器水平协议),还是数据安全性等,都要求运营商能够满足要求。在国内,由于相关法律条文的欠缺,以及整个社会在公信力方面的欠缺,面向企业的云存储服务还存在着很多障碍。但是,这些障碍在企业内部并不成为障碍,随着经济全球化的发展,地球村的出现,整个世界已经变成了平的,那么,透过一个或几个集中式数据中心,为企业各分支机构提供全球统一标准化的支持和服务,这已经成为了一种趋势。借助云存储的思维,企业内部的云存储服务将充满了勃勃商机。

  云存储的思路,也被IT厂商借鉴到了市场竞争中,如惠普推出的一项新的金融服务--Financial Services,承诺无论用户现在采用何种品牌的存储产品,惠普均可以对它们进行作价并收购,然后再以服务租赁方式向用户提供存储服务,用户只需要按月购买服务。此举可以有效盘活用户的资产。那么,惠普为什么敢于开展这样的服务,据此间的业内人士分析,惠普的底气就来自于类似云存储的服务,通过对于现有存储技术加以纯熟的应用,并进行必要的改造,有关专业服务人员可以更加有效管理和利用现有存储资产,发挥更大的效益。同样的产品,不同的管理水平,其成效大相径庭。以存储虚拟化技术为例,尽管技术已经比较成熟,但是受各种因素制约,很多用户并不能够很好的对其加以利用。但是对于专业化人员而言,通过存储虚拟化,构建庞大的存储池,就可以充分发挥现有存储产品最大能力,而这并不需要更多的投资。

目前云存储系统结构模型由4层组成。

  存储层:它是云存储最基础的部分。存储设备可以是FC光纤通道存储设备,可以是NAS和 iSCSI等IP存储设备,也可以是 SCSI或SAS等 DAS存储设备。云存储中的存储设备往往数量庞大且分布多不同地域,彼此之间通过广域网、互联网或者 FC光纤通道网络连接在一起。

  存储设备之上是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。

  基础管理层:它是云存储最核心的部分,也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问,同时,通过各种数据备份和容灾技术和措施可以保证云存储中的数据不会丢失,保证云存储自身的安全和稳定。

  应用接口层:应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。比如视频监控应用平台、IPTV和视频点播应用平台、网络硬盘引用平台,远程数据备份应用平台等。

  访问层:任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。

  尽管云存储有这样四层结构的划分,并且有一些尖端的技术也正处在研发阶段,例如EMC所宣布的道里(Daoli)可信基础架构项目,旨在提供可信的云计算平台,使用虚拟化和可信计算技术,支持对单个主机计算机环境进行隔离,使之适合租借给多用户。简单说,道里项目就是解决云计算下的安全问题。

  但是现有存储产品和技术已经足以支撑企业内部云存储服务需求。EMC中国研发中心首席架构师任宇翔在一次采访中指出,采用现有的存储产品,如 EMC高端存储产品Symmetrix或者中端产品CLARiiON作为云存储的存储层加以构建,从技术上将没有任何的问题。但是如果作为一种面向公众的云存储服务,那么其成本未免就有些太高了。为此,他提出,云存储应该拥有几个基本的特征:一是大容量。云存储的最大存储容量可达数PB。二是低成本,已 Google为例,为了降低存储的采购和运维成本,它们的存储系统通常是自己“攒”的。第三是灵活的扩展能力。他指出,云存储是存储技术的集大成者。虚拟化、数据压缩、重复数据删除、安全、基于策略的管理等都是云存储应该具备的能力。

  几大云存储产品

  如果用大容量、低成本和灵活扩展能力等几个要素对云存储产品加以衡量,那么,有几个突出的产品应该引起我们的注意。

  Atmos

  Atmos是EMC公司所发布的云存储基础架构解决方案,它具有自动配置、自我修复的特征,可以扩展到PB级。据了解,Atmos使用了一种基于策略的管理系统,让服务提供了可以建立不同类别云存储的能力,比如说,其可以为非付费用户创建文件的两个副本,并存储在全球不同的地点,并为付费用户创建5~10份备份进行存储,并提供了其在全球各地访问文件的更高的可靠性和更快的访问。在软件系统中,Atmos包括数据服务,如复制、数据压缩、重复数据删除,通过廉价的标准x86服务器从而获得数百TB的硬盘存储空间。EMC承诺说其拥有自动配置新的存储空间并自适应硬件故障的能力。也允许用户使用Web服务协议进行管理和读取。目前 Atmos有三个版本,系统容量分别为120TB、240TB和360TB,它们全部都基于x86服务器并支持千兆或10GbE以太网连接。

  ExDS9100(StorageWorks 9100 Extreme Data Storage)是惠普是针对文件内容的海量可扩展存储系统,该系统结合了惠普PolyServe软件、BladeSystem底盘以及刀片服务器以提高性能,还使用了被称为“块”的存储。这些块在同一个容器中包含了82个1TB的SAS驱动器。

  ExDS9100专为简化PB级数据管理而设计,为Web 2.0及数字媒体公司提供的全新商业服务,包括图片共享、流媒体、视频自选节目及社交网络,所带来大量的以文档为基础数据完全满足即时存储与管理的需要。同时可满足石油及天然气生产、安全监控及基因研究等大型企业的类似需求。

  ExDS9100是一个统一的系统,配备以下三种主要配件:

  Performance block:高能效的HP BladeSystem机箱配备刀片服务器,可满足海量高性能运行的需求。解决方案的基本配备包括四块刀片,可扩展至16块刀片配置,每个单元拥有高达12.8个核心,性能可以达到每秒3.2 GB。

  Capacity block:基本配置提供三个高可用性的存储块,及高达246 TB的存储容量。最高配置能支持达10个存储块,提供820 TB的存储容量。

  Software:该系统采用HP的文件集群技术,满足Web 2.0及数码环境的严格要求。为降低系统的复杂性及成本,应用程式可直接在服务器模组上运行,删除不必要的软件层。透过单一的图像管理界面,用户能够轻松管理更多的存储产品和设备。

  XIV

  XIV是IBM提供的新一代存储产品。它采用网格技术,极大的提高了数据的可靠性、容量的可扩展性、系统的可管理性。

  XIV是在传统的存储设备以上的升级。它具有海量存储设备+大容量文件系统+高吞吐量互联网数据访问接口+管理系统的设计特征。XIV由于其独特的设计,使之天生就具备海量的存储能力与强大的可扩展性,能够满足各种Web2.0应用的需求,是一个理想的实现云存储的产品。

  “XIV产品具备IBM信息管理、保护、归档等重要职能,是 IBM信息基础构架和存储关键的组成部分,也是 IBM能够重新定义存储的理念的一个产品。”IBM系统与科技事业部大中华区产品部总经理侯淼说。

  XIV结构把中端和高端存储的特点结合在一起。当用户有了新的业务,或者数据快速增长,并能够预计未来业务有高速度增长,数据类型复杂,这种情况下 ,XIV都是用户目前合理的选择。

  XIV存储系统内置的虚拟化技术大幅度简化了管理及配置任务,瘦供给功能改善了 IT操作,快照功能几乎可达到无限次,并可瞬间克隆数据卷,显著提升测试及访问数据库操作的速度。它的宗旨是通过消除热点与系统资源的全部占用,提供高度一致的性能。IBM?XIV 存储系统能够帮助用户部署可靠、多用途、可用的信息基础结构,同时可提升存储管理、配置,以及改进的资产利用率。

0
相关文章