云计算 频道

上汽集团云数据中心OpenStack云化之路

  案例概述

  本文将详细阐述上汽集团云数据中心使用OpenStack的历经之路。整个项目于2015年10月启动,2016年6月正式上线,目前群集规模已超过500台物理服务器节点,超过1000台VM和1PB的存储量。未来,云平台将设计成两地三中心,超过5000台服务器规模,上万台VM和超过10PB的存储空间。

  业务背景

  上汽集团云数据中心建设与2014年,占地面积1600平方米。其隶属于上汽集团股份有限公司(SAIC)。云数据中心于2015年启动以开源开放架构的OpenStack为核心的云计算开源项目。历时大半年的研发与投入,于2016年数据中心云平台正式上线并进入运营期,上汽集团为其命名为SAICStack。SAICStack作为互联网汽车云平台现目前已经支撑了上汽互联网汽车、上汽商用车C2B和上汽乘用车官网等10多种业务,未来该平台还将支撑上汽几十家子公司的“互联网+”业务。

  业务系统及应用场景的底层云化,为上汽集团互联网+的战略布局提供了良好的基础能力,上汽集团SAICStack联合研发团队完成了在国内汽车行业OpenStack云开源项目建设的创举。云数据中心的落成,上汽集团真正实现了由软件定义数据中心,平台拥有自动化运维及部署的能力,体现了智慧数据中心的理念,并奠定了其在业内领先的地位。

  用户需求痛点

  上汽集团云数据中心在选择平台架构伊始,作为一家传统的汽车企业要走出创新的一步绝非易事。摆在上汽集团云数据中心面前的难题,在于是采用上汽一贯传统框架的商业软件解决方案,还是采用以开源开放为框架的开源软件解决方案。商业软件的解决方案的优势在于能迅速的建立数据中心基础平台完成基础资源的整合,但是其解决方案在灵活性,扩展性,后期成本投入包括对互联网应用的支撑都存在着明显的劣势和不足。

  互联网时代,应用为王。如若不能很好的支撑应用的平台那么就等同于白白投入建设资金,给公司造成损失。开源解决方案现目前已经成为互联网应用支撑的主流,但是开源也有其劣势,比如在成熟度和稳定性方面还有许多地方需要改善。使用开源解决方案也需要对其开源软件技术特性有足够的使用经验和驾驭的能力。这不得不让上汽集团云数据中心谨慎的选择合作伙伴和供应商。

  解决方案概述

  架构设计上,SAICStack平台秉承着开源开放设计宗旨,摒弃了传统OpenStack厂商将一款开源开放的软件打造成另一款闭源的商业软件的做法。SAICStack基于源生OpenStack版本提供了很好的行业非常好的实践,摸索出一套针对OpenStack源生各类版本升级更新、组件扩展、性能调优、容灾高可用等方式方法论。

  云部署整体架构描述

  SAICStack是一个可以用来运行大规模核心应用,并且能够提供高SLA保障的云平台。它以OpenStack为核心,除了提供通用的云资源管理功能外还集成了运维管理、安全管理和诸多外部支撑系统。

  技术堆栈:

  n 采用Openstack Liberty版本,使用模块包括:Nova、Neutron、Cinder、Glance、Keystone、Heat

  n 计算集群:KVM

   存储集群:Ceph、Local Disk、SAN、NAS

   Layer2网络:OVS、LinuxBridge;VLAN、VxLAN、OpenFlow

   Layer3网络:vRouter(Neutron L3、vyOS)、物理Core Router

   Layer4-7网络:HAproxy、LVS、F5

   运维模块:Zabbix、Ansible、Cobbler

  集群设计

  整个云平台分为3个集群:

   Production(生产)

  设计目标:提供高SLA级别的资源,控制的资源利用率。

   虚拟化系统启用的提高性能和可靠性的模块或者参数,CPU及内存禁止Overcommit

   网络采用LinuxBridge+VLAN方式保障网络可靠和高效,3层交换及L4-L7网络采用物理设备。

   存储采用双Ceph集群即数据复制技术保障存储可靠性,集群磁盘采用SSD+SAS保证IO及吞吐。

   部分核心应用使用IP-SAN存储。

   Staging(准生产)

  设计目标:提供中等SLA级别的资源,增加的资源利用率和灵活性。

   虚拟化启用一部分提高性能和利用率的模块或者参数,设置较低Overcommit Ration值

   网络采用OVS+VLAN方式,L3启用vRoute(vyOS)

   存储采用单Ceph集群及SATA磁盘

   R&D(开发测试)

  设计目标:提供普通SLA级别的资源,最大化提高资源利用率和灵活性。

   虚拟化启用提高利用率的模块或者参数,设置较高Overcommit Ration值

   网络采用OVS+VxLAN方式,启用Neutron L3及L4-L7服务(HAProxy)

   存储采用本地盘

  技术和方案亮点

  OpenStack+

  原生OpenStack只是一个框架,其提供的功能有诸多不足,为保障云平台体系的一致性和可维护性(补丁及升级),SAICStack基于Openstack Extension框架进行了功能扩展,避免通过修改源代码后照成后续版本迭代和升级困难。

  高可靠性

  采用全冗余、多Region、分级故障域架构设计。云平台从上线运行至今,最长的VM已经稳定运行超过一年,SLA高于每月99.95%的预期。

  高性能

  基于同样配置或者成本投入下的硬件,云平台整体的资源性能,包括运算性能(KVM虚拟化)、IO性能(Ceph分布式存储)都超过基于传统SAN存储的VMware架构。

  灵活性

  IOT应用有别于传统应用和互联网应用,云平台面临更高的SLA需求和业务容量井喷。采用多Region调度和分布式存储技术,可以较高提升云平台的整体可用性和具有热扩展及弹性。

  客户价值

  2016年,中国汽车行业进入到了自主品牌竞争力的3.0版本,这个时代的特点是高效内燃机动力、新能源和智能互联的竞争。互联网汽车就是在行业竞争力3.0版本中所诞生的产物,上汽荣威RX5就是中国首款互联网汽车的代表之作。

  云数据中心是这一时代汽车行业不可忽视的重要生产力,它支撑了全部互联网汽车业务以及汽车大数据平台。如果将大数据比作未来汽车的引擎,那么上汽集团的SAICStack云平台就是未来汽车的底盘!

  案例效果

  n SAICStack为云数据中心带来了更加灵活和成本更可控的底层云平台;

  n SAICStack与本地数据深度整合,是比公有云更安全和更低成本的云平台;

  n 去商业软件化,除了降低成本外,更重要的是避免了厂商的锁定,定制更灵活更匹配业务的云平台;

  n 运行了近一年半的SAICStack云平台,从稳定性到性能各方面都已经满足了我们业务系统的需求,我们的业务还在继续增长,云的规模也稳定的扩展。

  案例价值

  上汽集团的SAICStack是支撑上汽创新业务的公路和桥梁,它已经体现出其在上汽集团“互联网+”业务中不可取代的重要性,同时为上汽集团传统业务互联网化、云化打下了深厚基础。

  上汽集团将继续拥抱OpenStack开源体系,将SAICStack打造成既能支撑互联网创新业务又能支撑传统业务改造的多功能云平台。

  在“互联网+”的浪潮中,一个公司的基因常常决定了它的命运,而转基因对于大多数公司来讲是近乎不可能的。但是凡事总有例外,总有像上汽集团这样的公司从传统领域成功转向新的高速发展的领域。从此,公司之间就有了伟大和平庸的差别。

3
相关文章