“CPU+GPU”混合架构打造云计算平台
那么用什么样的技术来搭建云计算平台呢?传统的做法一般是通过基于X86处理器的服务器来构建大规模的集群。不过,如果单纯依靠CPU服务器来构建计算集群,随着规模的扩大,在功耗、管理、占地空间、成本等方面就会面临一系列问题。
“这些瓶颈在我们一期的20万亿次平台中就已经存在,所以在二期的百万亿次平台中,我们选择了CPU+GPU这样一种异构方案。” 曾宇告诉记者,通过采用NVIDIA公司的Tesla系列GPU产品,希望借助其图形处理和高性能计算方面的出色性能,为计算机辅助工业设计制造、图像处理、石油、生物等应用领域提供更先进高效实用的解决方案。
NVIDIA公司全球副总裁、PSG亚太区总经理Steve Furney-Howe也谈到,在日本和美国已经有一些针对高性能计算的云服务,可以为中小企业定制服务和应用。这些企业使用GPU加速技术,不仅成数十倍甚至百倍提高计算效率,面且可以节省大量能源。实际上,在中国,GPU加速这两年来也已经成为HPC业界的热点,无论是曙光今年冲击全球高性能计算机排行榜TOP2的千万亿次超级计算机“星云”,还是中科院过程所正在使用的大型系统,都使用了“CPU+GPU”的异构方案。
NVIDIA公司代表与北京计算中心代表合影
据了解,除了提供GPU产品来加速并行计算效率之外,NVIDIA不久前还专门推出了基于GPU的云3D解决方案,包括一款基于云计算的高端服务器RealityServer,该服务器的出现令所有连接到网络的设备享受照片般真实的交互式3D应用程序成为可能。举个例子,用户在选购家具之前,不用花一分钱,就可以通过家具企业提供的实时的照片级的渲染服务获得逼真的效果,比如选用的材质是否合适,在夜晚灯光下的实际效果如何等等,用户通过手机、PC等各种终端就可以与设计师实时交流看法。这种云渲染还有助于跨地区企业的研发工作效率,比如一辆汽车的发动机在德国设计,音响系统在日本设计,底盘在美国设计,外形在中国设计,以前要在真实环境中进行组装才能看到效果,而通过渲染云,在网上就可以实时组合,研发人员可以进行交互修改。
对此,曾宇也认为,要提供工业设计云服务,光搭建一个计算平台显然是远远不够的,还需要整合前端的工业设计应用软件,以及后台的专家人才支持队伍,这样才能真正打通产品从设计、开发、验证、模拟的整个链条,北京市计算中心也将朝这种“产业垂直云”的方向发展。
为此,在GPU平台上开发、迁移和测试验证工业应用软件将是未来联合实验室很重要的一项工作。NVIDIA中国PSG销售经理谢强告诉IT168,CUDA的出现其实已经让GPU编程难度大大降低,用户使用普通的C语言就能编写软件。目前GPU软件主要有三个来源:一是开源软件,双方可以联合开发;二是有源码的自由软件,双方会进行迁移测试;三是对于比较昂贵的大型商业软件,NVIDIA公司正在跟各大软件厂商合作进行移植,这也是NVIDIA全球的战略重点。“对于动辄上百万行代码的大型商业软件而言,移植起来会比较困难一些,毕竟中间有一个过程,不过在有限元分析、机械力学等领域已经有一些软件移植成功。”
据了解,北京市计算中心与NVIDIA公司共建联合实验室之后,双方将本着优势互补的原则,面向公共计算领域,开展项目研发、学术交流、人才培养、设备采购等全方位的合作。通过合作,北京市计算中心及时跟踪NVIDIA的最新产品及技术,充分利用其产品、技术资源和平台,积极开展将顶尖的图形处理技术和高性能计算技术转化为特色应用服务的研究,共建具有国际一流水平的特色云计算技术研究实验室,为公共计算领域提供更好的服务支持和云计算用户体验。