【IT168 资讯】Linux集群厂商企鹅计算公司(Penguin Computing)最近有点兴奋——尤其在“云中的高性能计算”浪潮中宣布将要实现高性能计算按需服务之后。所谓Penguin On Demand(POD),是指用户可以即付或者包月的方式来使用相对应的高性能计算基础设施。
POD至少包括了超过1200颗至强处理器遍布在一个单一机器的不同集群里。企鹅计算公司提供了使用以太网或者DDR Infiniband互连技术的选择,还可以选择使用Nvidia 的Telsa GPU。不过按照云计算的标准来看,这里提供的内核数量实在是微不足道。但是企鹅销售的都是正在成长的系统,客户不断增长的需求将使得他们比较容易且迅速地扩大基础设施。
按照企鹅给出的说法,按需设施需要有足够的带宽允许大量的数据能够通过互联网来转移到所定制的资源上。因此他们还推出了“Disk Cadyy”服务允许1TB的文件瞬间被转移。这些硬盘包括在被定制的基础设施里,用户可以拥有这些磁盘,当数据被全部转移到POD存储设备之后归还。
软件方面,企鹅提供了一个叫做CentOS的软件,以红帽公司的企业版Linux为母本开发,包括了该公司的Scyld ClusterWare集群管理软件。“当客户的要求随时增加或者减少的时候,Scyld使得我们能够很快地给出一套有效的计算节点。”企鹅计算公司的CEO Charles Wuischpard如此表示。
企鹅希望POD能够成为多样化的垂直整合产品。按照Wuischpard的说法,他们最早在生命科学行业,但是最近在一些财富500强里的制造企业与一些较小的对冲基金公司发现了机会。
通过使用Scyld套件企鹅内部的用户也可以使用POD服务。Scyld ClusterWare包括TORQUE和一个叫做“任务控制(TaskMaster)”的调度工具,比如当某一特定阈值达到工作要求,本地资源会自动定向到POD系统中。
不同于常见的云计算模式比如亚马逊的EC2弹性服务,应用程序直接运行在没有虚拟化计算的节点上以达到非常好的效果。Wuischpard解释说,POD更倾向于是一个在高性能计算环境里更加活跃的系统,如果它工作在一个虚拟了的云环境里的话,很有可能因为资源匮乏而“饿死”。
因此,从这个意义上说,POD并不是一个经典意义上的“云”,而是一个专门的按需高性能的基础设施。事实上,企鹅所应用的模型和许多按需使用的高性能计算资源一样,比如IBM的按需云计算和R系统专用的托管服务。到目前为止,虚拟专用设计的高性能云计算尚未出现。
从这个层面上说,对于云计算最大的批评是他们缺少低延迟的MPI应用程序的支持。正像是Lan Foster所指出的那样,短期运行的高性能计算应用可能并不会有太大的问题。但是当程序运行到几个小时、几天甚至更长时间,快速的服务器与服务器之间的通讯就变成了所有事情。不过至少还有一些技术比如Infiniband是可以具有这一优势的。
建立一个POD帐户需要企鹅技术人员一些初步的手控。他们有助于建立计算环境,解释管理功能,并回答任何问题。在此之后,POD的服务可以通过SSH来直接运行应用程序。如果客户需要更多的帮助,企鹅技术人员随时在线帮助解答问题(通过客户门户)以帮助随时可能出现的问题,或者帮助用户更高效地使用计算资源。
据企鹅计算公司介绍说,与传统的云计算产品,POD可以提供显著改善性价比的高性能计算应用(其含义是,相对亚马逊的EC2你可能为每颗CPU付出的小时价格更多,但是你获得性能将抵消该价差)。“用户只需要为他们使用的CPU按小时付费,” Wuischpard表示说,“每个月都是有合同的,其中规定了每个核心降低的平均成本。”
不过,企鹅并不提供QoS保证,但是Wuischpard说如果客户有这样的要求可以按照执行。他说,如果是因为物理器件的故障导致任务失败,可以重新运行。
从商业角度来看,这种“将OEM视为云供应商”将是一个有趣的模式。在利润率相对缩小的商品为基础的集群来看,销售这种按需设施可以提供一种新的收入方式。对于一些云计算的关注者来说,租用CPU运算周期对系统供应商来说至少是一个合理的选择。