云计算 频道

微软NVIDIA携超大规模GPU加速驱动AI云

  【IT168 资讯】在过去五年中,云计算几乎已经成为了每个企业IT战略的核心组成部分。

  可以预见的是,新一波云的增长将会由那些希望通过使用机器学习和人工智能(AI)等先进技术从根本上改变其业务的企业驱动。

  在过去一年中,我们看到了很多关于AI的使用案例,包括打扑克,写新闻故事,提交保险索赔,驾驶汽车和编写代码等等。它的兴起将会改变世界,改变我们的生活和工作的方式。 希望利用智能云计算的企业必须确保其云提供商的架构能够跟得上这种计算过程创造的新需求。

  在接下来的几年中,我们预计它将会大幅影响我们的生活,包括教育,医疗保健,客户服务,研究和开发以及你可以想到的任何事情。 如何利用AI加强创新已经成为了成千上万企业正在思考的问题。

  日前微软和NVIDIA共同推出了第一个超大规模GPU加速器计划,以实现可扩展的AI云。新的HGX-1是一个开放源码设计,将为云提供商提供最快,最灵活的AI路线。

  几十年前,英特尔和PC厂商设计了ATX(高级技术扩展)来改进标准PC组件,如主板,安装点和电源。 HGX-1试图在云中发挥类似的作用,Nvidia表示,HGX-1可以满足AI兴起后的爆发性需求。

  HGX-1是基于NVIDIA NVLink互连技术和PCIe标准的创新设计,使CPU能够动态连接到任意数量的GPU,由每个机箱中的八个NVIDIA Tesla P100 GPU提供支持。 这使得云服务提供商能够在HGX-1基础设施上实现标准化,为客户提供一系列CPU和GPU机器实例配置。HGX-1 AI加速器提供了极高的可扩展性,可满足快速增长的机器学习工作负载的苛刻要求,其具有与全球数据中心协作的灵活性,可为现有的超大规模数据中心提供快速,简单的AI路径。

  现在,云工作负载比以往任何时候都更加多样化和复杂。HGX-1的高度模块化设计允许无论工作量如何都能获得非常好的性能。 与传统的基于CPU的服务器相比,它可以提供高达100倍的深度学习性能,并可以大幅节约AI训练和推断的成本。例如,考虑启用一个医疗保健应用程序的AI。 在早期,它会消耗和分析大量的数据用于其学习阶段,并且可能需要大量的GPU。 一旦过程成熟,它将从学习转变为推断,GPU需求便会下降。 客户可以自定义CPU和GPU的使用,来满足任何类型的工作负载,随着过程成熟和需求的改变进而进行调整。

  据悉,NVIDIA正在加入开放计算项目,以帮助推动AI和数据中心的创新。 该公司计划继续与微软,Ingrasys和其他成员合作,为云服务提供商和其他数据中心客户推进适用于AI的计算平台。

0
相关文章