Intel MIC技术首次商用部署：Stampede-云计算专区

Intel MIC技术首次商用部署：Stampede

作者：chusansir编译编辑：唐蓉 2011-09-25 02:08 IT168网站原创

HPC存储模板

　　【IT168 专稿】德克萨斯高级计算中心(TACC)透露了部署尖端的千万亿次超级计算机计划，所需的2750万美金由美国国家科学基金会(NFS)提供。该超级计算机系统由Dell提供，由2个千万亿次Sandy Bridge-EP处理器组成，该处理器采用的是Intel较多核心(Many Integrated Core，MIC)协同处理器，宣称处理能力可达8 petaflop。该超级计算机预期将在2012年年底启动，在2013年1月份投入运行。

　　这不仅仅是Dell的首个千万亿次系统—至少是第一个公开报道的系统—同样很可能是Intel MIC技术进入商用的第一次部署。在这种情况之下，提及的芯片是Knights Corner的预生产版本，而Knights Corner是该生产线的第一个商业版本。早期的芯片将与以后生产的芯片相同。

　　该超级计算机系统将被称为Stampede，该系统将为传统的数值计算HPC应用以及NSF极端数字(XD)用户社区内的数据驱动的分析应用提供服务。XD包括计算科学以及工程探索环境(XSEDE)项目，是TeraGrid的后续项目。TeraGrid由超过12所大学以及两个研究实验室组成。对于XD用户来说，在10 teraflop级别Stampede将提供最强大的计算能力。

　　据Stampede项目的TACC主管Jay Boisseau所说，从一开始将有数百个项目运行在该系统之上。他向HPCwire网站解释说：“我们想引入使用大数据集进行大规模分析的用户以及模拟类型用户。”

　　数值密集型科学应用包括了地理科学传统的生物信息学，同样还包括地理科学以及天文学。这些应用领域已经积累了大量的数字资料。Jay Boisseau认为Stampede系统多达50%的资源将用于这类应用。

　　数值密集型支持将引入新的用户集，很多用户并不是使用HPC进行传统的模拟。为此，Jay Boisseau计划为这部分用户开发更加丰富的软件环境，包括新的应用门户和通道。这一计划自TeraGrid项目开始。除此之外，为支持数据驱动应用领域，他们将引入统计学，数据挖掘以及数据管理等方面的专家。

　　一些专业技术和软件资源已经通过大学合作构建在项目中。除此德克萨斯大学奥斯汀分校外，合作院校还包括了南卡罗来纳州大学，美国科罗拉多州大学，康奈尔大学，印第安纳大学，俄亥俄州大学以及德克萨斯大学厄尔巴索分校。

　　Stampede的硬件有两个千万亿次集群构成，包括了6400个x86计算节点，高速互联可达56 Gbps。每个节点配置了两颗Intel 8核Xeon E5处理器(代号为Sandy Bridge-EP)以及32GB的内存。

　　Stampede还包括了16个大内存节点，每个节点支持1TB的内存以及2颗NVIDIA GPU。能够满足超大规模SMP应用对容量的需求。Jay Boisseau说他们同样在考虑采用ScaleMP的虚拟SMP解决方案构建高达16TB的共享内存环境。共享内存子集群专门用于某些大数据分析应用。

　　该集群同样连接了Lustre存储节点。Lustre存储节点同样也由Dell提供，包括14PB的磁盘容量，融合带宽可达150GB/s。Jay Boisseau说：“在本项目的生命周期之内，我们希望能够增加大量的容量与带宽。”

　　该系统由Dell数据中心解决方案部门所开发，代号为Zeus。虽然是初次应用在Stampede中，但是Dell希望在2012年使Zeus产品能够广泛应用在超大龟毛的超级计算中。

　　Stampede的基本集群和存储节点占据了NSF所提供资金的绝大部分，共计2500万美元，剩下的250万美元将购买8 petaflop的MIC协同处理器，MIC协同处理器通过 PCIe 3.0与x86节点相连。MIC基于x86的多核HPC架构，面向高度并行的节点，将于NVIDIA的Tesla以及AMD的Firestream GPU展开正面竞争。

　　但是GPGPU发烧友并没有遭到怠慢。除了共享内存节点的GPU之外，6400个常规节点中的128个节点配置了NVIDIA下一代Kepler GPU用于支持远程虚拟化。Kepler是Fermi的下一代产品，也就是NVIDIA目前的GPU架构。配置了Kepler 的Tesla将在2012年的某个时间开始接受预订。

　　Intel官方还没有发布Knights Corner MIC产品的发行日期，但是应该会在2013年的某个时间推出。如果Intel 22nm处理技术更能够更快推进的话，或许在2012年底我们就能获取该产品。Stampede真正使用的MIC编号不是公开的，但是Intel已经承诺所提供的MIC产品计算峰值肯定能够达到8 petaflops。

　　简单以计算一下，每个MIC芯片很可能至少需要提供的双精度计算能力为1.3 teraflops到1.5 teraflops，这样才能达到8 petaflop的性能指标。非常巧合的是， NVIDIA's Kepler GPU预计提供的双精度计算能力也是1.3 teraflops到1.5 teraflops。需要指出的是，第一个MIC是采用Intel Tri-Gate 22nm技术实现的，而Kepler GPU将采用标准的28nm技术制造。

　　目前，Jay Boisseau期望能够在今年秋天同时获取Intel所有的MIC协同处理器，这样可能能够赶得上11月份的Top500。到那时，Sandy Bridge计算节点应该能够全部部署。如果一切都照计划进行，从2012年12月份开始早期用户应该能够在Stampede上运行代码了。

　　尽管MIC将支持若干个并行计算模型，但是最直接的模型就是OpenMP。这对采用MPI-OpenMP混合编码的用户非常有帮助。为实现并行循环，其想法就是卸载OpenMP大块给协同处理器。为使用MIC加速计算，直接使用MPI编码的用户将需要做更多的工作。

　　Stampede的升级版本正处于设计阶段。大概两年之内将投入使用。TACC计划采用另一批芯片部署下一代MIC协同处理器，目标是为系统增加5 petaflop的计算能力，在使用中段将峰值计算能力提高到15 petaflops。

　　NSF将为Stampede提供至少4年的经费。除了初期构建、安装系统的2750万美元外，另外的用于系统运行、支持的大约2400万美元也已经提上了日程。这样对Stampede项目的总投资将超过5000万美元。Stampede项目同样包括在2017年进行更新的选项，这将导致在使用末段部署一个规模更大、计算能力更强的超级计算系统。