云计算·大数据 频道

业务上云评估,应用系统和业务数据是重点

  业务上云分类前,我们首先按照业务上云方法(图1),完成对现有业务上云的范围的梳理分析,区分出哪些业务可以上云(总结建议见表1)、哪些业务不适合上云(总结建议见表2)。

  图1:业务上云方法

  表1:建议上云业务

  表2:不建议上云业务

  对于能上云的业务,“应用系统”单独上云、“应用系统+结构化数据”上云、“应用系统+非结构化数据”上云,这三种情况都视为业务上云。业务上云方法可以参考图1。选定上云业务后再选适宜的云架构场景,如集中式X86虚拟化架构、分布式X86虚拟化架构,确定云架构场景后来选择适宜的存储。对于分布式应用云化改造按实际情况评估后进行改造,应用云化是以应用层 SOA 化、数据层分库分片等技术来将大型应用系统的接入层、应用层、数据层都精细化的解耦为大量服务化组件,再通过分布式计算框架集成组件,实现组件之间的信息路由、负载分配、容错处理等。整体来看,信息系统逐步向“全面云化”、“分布式化”、“智能化”、“开放化”的新技术体系演进。将通过建设分布式存储系统为计算资源池和应用平台提供所需的存储资源,满足应用系统数据在存储容量、性能、可用性和可管理性等方面的需要。

  业务上云存储服务

  1. 应用系统单独上云场景

  对于应用系统单独上云场景,应用前端采用X86虚拟化架构,后端存储为SAN、NAS、集群存储。

  2. 应用系统+数据上云

  对于应用+数据上云,在云环境存储一般使用云存储平台和融合存储。常以软件定义存储技术为主,软件定义存储以分布式存储为主,就是将硬件的可操控成分按需求,分阶段的,通过编程接口或者以服务的方式逐步暴露给前端应用,分阶段地满足应用对资源的不同程度、不同方面的灵活调用。目前,软件定义存储最显著的特征是呈现分布式,基于软件定义存储技术,构筑分布式块存储、对象存储、文件存储服务,实现按需供应、自动策略管理,满足不同的性能、容量需求。

  3. 应用+数据上云-混云/云原生/大数据云场景(融合存储)

  3.1 云化存储对接

  云化对接主要包含两大块,一是对接开源的云管理平台,例如OpenStack的块接口Cinder、文件接口Manila、对象接口Swift和当前主流的AWS S3接口,容器CSI(Container StorageInterface)接口;二是对接商业的云管理平台,通过云管软件调度,如VMware ESXi、MicrosoftHyper-V等。

  云原生存储:根据容器存储驱动程序的实现,容器存储卷有以下两种方式来对容器编排提供存储资源:

  块:块存储卷,将作为容器内部的一个虚拟块设备出现。这些设备直接通过FC、FCoE、小型计算机系统接口(SCSI)或Internet SCSI(iSCSI)等底层协议。块存储主要提供给管理块级数据的数据库服务。

  文件:使用文件系统挂载的卷,它将作为容器内的目录出现。容器化的应用程序使命令(如打开、关闭、创建和删除)与存储进行通信。

  云原生存储实现NFS/iSCSI 全协议支持,云原生存储可实现虚拟化向容器平台平滑演进,支持分布式文件系统+CSI,支持多云/虚拟化/容器平台部署,底层实现构建统一存储池;软硬解耦,支持异构CPU硬件平台,有效保护IT投资和快速部署能力;数据分层流动,支持本地、异地、云上多环境的数据流动,包括在线数据迁移、远程复制、备份归档,支撑数据全生命周期管理;支持跨代次、跨品牌的硬件集群,设备维保到期免数据迁移;完善的硬盘/网络亚健康检测机制,高效主动运维,降低分布式架构体系下的运维复杂度。

  3.2 大数据存储场景

  Hadoop是数据湖最常用的解决方案,但是,HDFS存在扩展性不够,容量无法独立扩展,缺乏企业存储特性,存在难于维护和成本高昂的问题。存算分离可以有效解决这些问题。存算分离架构已是公认的未来架构演进方向:云平台存算分离、大数据平台存算分离、分布式数据库存算分离、容器云天然要求存算分离。大数据存储支持NFS、CIFS、HDFS、S3等多协议的互通,支持Hadoop、MPP、AI等计算数据共享应用,避免数据在平台之间频繁的导入导出。对于数据交换平台也可采用高性能的分布式全闪存NAS存储提供服务。

  存算分离部署:无缝对接Hadoop大数据平台,存算分离支持容量和计算独立按需扩展,没有HDFS的扩展限制。

  丰富容灾特性:EC(纠删码)、双活、多站点、数据分层等多种企业级数据保护特性,帮助大数据平台数据持久保存。

  便捷运维:丰富的企业存储特性,TCO更低,整池扩容、Recovery QoS、图形化界面等,有效降低运维成本。

  高性能:高性能客户端支持Impala、Spark、Hive等主流大数据应用,并且性能媲美HDFS。

  3.3 智能业务场景

  业务场景是“数据+算力+算法+场景”的综合体,存储需考虑存储如何为智能应用进行优化,大规模AI训练如何实现资源调度和性能优化。AI所需存储,可以分为准备、训练、推理和归档等阶段,每个阶段的IO特征不一样,对于存储的要求也不一样。依据业务特征阶段按需选择适宜存储,加速AI生产流程。

0
相关文章