云计算 频道

Intel MIC技术首次商用部署:Stampede

HPC存储模板

  ▲进入高性能计算专区

  【IT168 专稿】德克萨斯高级计算中心(TACC)透露了部署尖端的千万亿次超级计算机计划,所需的2750万美金由美国国家科学基金会(NFS)提供。该超级计算机系统由Dell提供,由2个千万亿次Sandy Bridge-EP处理器组成,该处理器采用的是Intel较多核心(Many Integrated Core,MIC)协同处理器,宣称处理能力可达8 petaflop。该超级计算机预期将在2012年年底启动,在2013年1月份投入运行。

  这不仅仅是Dell的首个千万亿次系统—至少是第一个公开报道的系统—同样很可能是Intel MIC技术进入商用的第一次部署。在这种情况之下,提及的芯片是Knights Corner的预生产版本,而Knights Corner是该生产线的第一个商业版本。早期的芯片将与以后生产的芯片相同。

  该超级计算机系统将被称为Stampede,该系统将为传统的数值计算HPC应用以及NSF极端数字(XD)用户社区内的数据驱动的分析应用提供服务。XD包括计算科学以及工程探索环境(XSEDE)项目,是TeraGrid的后续项目。TeraGrid由超过12所大学以及两个研究实验室组成。对于XD用户来说,在10 teraflop级别Stampede将提供最强大的计算能力。

  据Stampede项目的TACC主管Jay Boisseau所说,从一开始将有数百个项目运行在该系统之上。他向HPCwire网站解释说:“我们想引入使用大数据集进行大规模分析的用户以及模拟类型用户。”

  数值密集型科学应用包括了地理科学传统的生物信息学,同样还包括地理科学以及天文学。这些应用领域已经积累了大量的数字资料。Jay Boisseau认为Stampede系统多达50%的资源将用于这类应用。

  数值密集型支持将引入新的用户集,很多用户并不是使用HPC进行传统的模拟。为此,Jay Boisseau计划为这部分用户开发更加丰富的软件环境,包括新的应用门户和通道。这一计划自TeraGrid项目开始。除此之外,为支持数据驱动应用领域,他们将引入统计学,数据挖掘以及数据管理等方面的专家。

  一些专业技术和软件资源已经通过大学合作构建在项目中。除此德克萨斯大学奥斯汀分校外,合作院校还包括了南卡罗来纳州大学,美国科罗拉多州大学,康奈尔大学,印第安纳大学,俄亥俄州大学以及德克萨斯大学厄尔巴索分校。

  Stampede的硬件有两个千万亿次集群构成,包括了6400个x86计算节点,高速互联可达56 Gbps。每个节点配置了两颗Intel 8核Xeon E5处理器(代号为Sandy Bridge-EP)以及32GB的内存。

  Stampede还包括了16个大内存节点,每个节点支持1TB的内存以及2颗NVIDIA GPU。能够满足超大规模SMP应用对容量的需求。Jay Boisseau说他们同样在考虑采用ScaleMP的虚拟SMP解决方案构建高达16TB的共享内存环境。共享内存子集群专门用于某些大数据分析应用。

  该集群同样连接了Lustre存储节点。Lustre存储节点同样也由Dell提供,包括14PB的磁盘容量,融合带宽可达150GB/s。Jay Boisseau说:“在本项目的生命周期之内,我们希望能够增加大量的容量与带宽。”

  该系统由Dell数据中心解决方案部门所开发,代号为Zeus。虽然是初次应用在Stampede中,但是Dell希望在2012年使Zeus产品能够广泛应用在超大龟毛的超级计算中。

  Stampede的基本集群和存储节点占据了NSF所提供资金的绝大部分,共计2500万美元,剩下的250万美元将购买8 petaflop的MIC协同处理器,MIC协同处理器通过 PCIe 3.0与x86节点相连。MIC基于x86的多核HPC架构,面向高度并行的节点,将于NVIDIA的Tesla以及AMD的Firestream GPU展开正面竞争。

  但是GPGPU发烧友并没有遭到怠慢。除了共享内存节点的GPU之外,6400个常规节点中的128个节点配置了NVIDIA下一代Kepler GPU用于支持远程虚拟化。Kepler是Fermi的下一代产品,也就是NVIDIA目前的GPU架构。配置了Kepler 的Tesla将在2012年的某个时间开始接受预订。

  Intel官方还没有发布Knights Corner MIC产品的发行日期,但是应该会在2013年的某个时间推出。如果Intel 22nm处理技术更能够更快推进的话,或许在2012年底我们就能获取该产品。Stampede真正使用的MIC编号不是公开的,但是Intel已经承诺所提供的MIC产品计算峰值肯定能够达到8 petaflops。

  简单以计算一下,每个MIC芯片很可能至少需要提供的双精度计算能力为1.3 teraflops到1.5 teraflops,这样才能达到8 petaflop的性能指标。非常巧合的是, NVIDIA's Kepler GPU预计提供的双精度计算能力也是1.3 teraflops到1.5 teraflops。需要指出的是,第一个MIC是采用Intel Tri-Gate 22nm技术实现的,而Kepler GPU将采用标准的28nm技术制造。

  目前,Jay Boisseau期望能够在今年秋天同时获取Intel所有的MIC协同处理器,这样可能能够赶得上11月份的Top500。到那时,Sandy Bridge计算节点应该能够全部部署。如果一切都照计划进行,从2012年12月份开始早期用户应该能够在Stampede上运行代码了。

  尽管MIC将支持若干个并行计算模型,但是最直接的模型就是OpenMP。这对采用MPI-OpenMP混合编码的用户非常有帮助。为实现并行循环,其想法就是卸载OpenMP大块给协同处理器。为使用MIC加速计算,直接使用MPI编码的用户将需要做更多的工作。

  Stampede的升级版本正处于设计阶段。大概两年之内将投入使用。TACC计划采用另一批芯片部署下一代MIC协同处理器,目标是为系统增加5 petaflop的计算能力,在使用中段将峰值计算能力提高到15 petaflops。

  NSF将为Stampede提供至少4年的经费。除了初期构建、安装系统的2750万美元外,另外的用于系统运行、支持的大约2400万美元也已经提上了日程。这样对Stampede项目的总投资将超过5000万美元。Stampede项目同样包括在2017年进行更新的选项,这将导致在使用末段部署一个规模更大、计算能力更强的超级计算系统。

  推荐阅读:HPC社区

0
相关文章