云计算 频道

Platform:从高性能计算到云计算

  成功案例:欧洲核子研究中心(CERN)利用Platform ISF实现私有云

  凭借强大的计算能力,欧洲原子核研究组织(CERN)为遍布48个国家270个研究中心的17000余名科研人员在全球范围内展开合作,共同破解物质和宇宙的种种奥秘提供了保障。

  挑战

  为了进一步加快研究进展,CERN需要构建经济高效、能够管理任何服务器上虚拟机管理程序和操作系统、共享的计算基础设施。为此,CERN建立了一个大型的强子对撞机(LHC)集群,并采用Platform LSF管理LHC集群工作负载。CERN结构基础设施(Fabric Infrastructure)小组负责人Tony Cass博士说:"我们从1997年就开始使用Platform LSF管理工作负载,Platform LSF同样适用于LHC。特别是当需要添加云功能时,与Platform LSF来自同一厂商的Platform ISF看起来再合适不过了。"

  解决方案

  Platform ISF为CERN的大批科学家提供了一套私有云计算基础设施,为多个虚拟和物理平台提供高效的工作负载应用管理。Platform ISF把不同平台组合到单一动态的共享基础设施中,在资源较少的情况下显著提高了平台的利用率。此外,科学家们可以选择自己的应用环境,动态控制项目,确保自己能充分发挥私有云的功效--而这一切都是在成本更低的情况下实现的。

  LHC项目给Cass博士领导的团队带来了一些新的挑战。LHC项目中大多数应用程序是高度专业化的,需要非常好的持续性,这给集群带来了很高的要求。支持LHC项目的新集群由200台服务器组成,新集群整体利用率只有10%左右。为了提高利用率需要对服务器进行虚拟化。新的虚拟化集群支持多种虚拟机管理程序,包括HyperV和Xen。这为实验团队带来了更大的灵活性,可以为自己的应用程序选用最好的平台。然而,多种虚拟化技术的使用给整个环境增添了管理的复杂性,于是Cass及其团队决定采用Platform ISF管理解决方案,作为同时管理虚拟环境和物理环境的工具。

  Platform ISF让Cass及其团队对环境拥有更大的控制权,而且通过自动处理虚拟机管理程序不但实现许多任务的自动化管理,简化了管理工作,还提高了管理效率。Platform ISF是整个解决方案的核心,它可以管理资源和应用环境,并提供让用户能够根据需要来预留和使用资源的契约接口。

  Cass说:"Platform ISF能够集成我们的所有资源,所以我们认为它是一种有用的补充,可以管理所有这些虚拟机管理程序。Platform ISF具有的独立性本身就让我们很感兴趣,因为我们的科研环境高度重视能够顺应新发展形势的工具,而不是让我们被旧形势所束缚。"

  Platform ISF部署在一个支持LHC的集群上,而Platform ISF Adaptive Cluster部署在负责进行批处理工作的HPC集群上--该集群由 3800台多核服务器组成。这让CERN可以建立起私有云环境,必要时共享不同集群之间的资源。

  Cass说:"Platform ISF Adaptive Cluster可以与现有的Platform LSF网格工作负载管理解决方案结合起来,为我们的用户和研究中心提供利用共享数据中心资源来管理集群所需的可扩展性和灵活性,同时符合我们对开放标准的要求。"

  成果

  利用Platform云平台实现私有云的另一个优点是减少了专用的LHC集群服务器。 "如果我们可以通过提高服务器利用率,从现有的LHC环境中减少150台服务器(原来是200台服务器),那么我们就可以大幅度节省电力和冷却成本,并且能在不增加硬件预算的前提下,把服务器重新部署到批处理集群中去。"Cass博士说。

  Cass还计划允许实验团队通过自助服务直接访问集群。"如果我们能让Platform ISF自动配置服务器,以满足实验团队提出来的工作负载要求,就将减轻我们的管理负担。过去,在静态资源环境中,利用Platform LSF可以减少管理日常应用的工作量;而现在,Platform ISF通过将耗时的人工管理转变为自动化的资源调配和管理,使我们能更有效地管理虚拟机和物理机组成的混合环境。"Cass预测,使用Platform ISF后,他们有望大幅减少重新配置批处理集群以满足不断变化的工作负载所需的工作量。

0
相关文章