云计算·大数据 频道

为云而生,AWS自研处理器AWS Graviton2带来超强计算能力

  云服务体验如何,算力一定是“杀手锏”,这也是亚马逊云服务(AWS)为什么要推出自研处理器的重要原因。

  AWS Graviton2超强算力背后

  近日,AWS宣布,由AWS Graviton2 处理器提供支持的 Amazon Elastic Compute Cloud(Amazon EC2)M6g、C6g 和 R6g 实例,已在由光环新网运营的 AWS中国(北京)地区和由西云数据运营的AWS中国(宁夏)区域推出。Graviton2是一款专为云原生而设计和开发的芯片,相比一代性能更强,更易用,性价比更高。

  “之所以推出Graviton2,其实想法很简单,就是为了让云上的现代化应用都能达到最真实性能。”AWS大中华区产品部计算与存储总监 周舸解释道,所谓真实性能,并不是拿一个跑分软件去做测试,最终得多少分,而是客户在应用Graviton2支撑现代化业务架构时的真实业务场景表现,并对每一个核去做特定优化,让其发挥最佳性能。AWS希望在一个CPU里放尽量多的独立的核,以便充分发挥平行扩展能力。

  Graviton2的计算实例由三个系列的家族成员构成,包括M6g、C6g、R6g。M6g代表的是通用型,内存跟CPU的核的比例是1:4;C6g是计算密集型,内存跟CPU的核的比例是2:1的比例,核的数量会更高一些;R6g是内存密集型,更适合于类似数据库类的应用,内存跟CPU的核的比例是8:1。

  Graviton2非常适合需要平行扩展的现代化应用,为了确保云端安全,AWS提供了全天候运行的256位内存加密。同时,可支持更广阔的生态系统,不管是ARM架构、Linux操作系统,还是Docker、EKS等容器服务,亦或者是CI/CD等开发工具和相关的软件,都可以直接导入使用。最重要的是,与相同配置的x86实例相比,Graviton2针对网络和计算密集型工作负载的性价比可高出40%。

  在很多人的潜意识里,会认为ARM的实例比较适用于基于ARM的游戏的开发,或者放在web应用的前端做接入,再或者只做缓存的工作。但基于Graviton2对核的设计的改变,可以大大拓宽基于ARM实例的适用范围,用户可以去跑开源的数据库,无论是MySQL、PostSQL,还是Redis都能得到性能的提升。很多用户甚至可以直接跑数据分析类的软件,或者使用C6g的实例去跑高性能计算里最典型的应用场景,比如对天气预测计算、流体计算等等。

  “目前,涂鸦已有40%的机器跑在AWS Graviton2 架构的实例上,未来我们会逐步迁移更多的机器。”涂鸦智能云端开发部首席架构师陈亚焱,对AWS Graviton2的性能表现给与了高度评价。作为一家全球化AI+IoT领军企业,该公司要处理设备的请求次数达到840亿/每天,高峰期请求处理次数达到150万/秒,为了做到毫秒级响应,公司把亿级物联网关架构在AWS Graviton2 上,最终让CPU的性能提升了100%,CPU占用率从之前的27%降到12%,服务器单价降低了20%。

  同样,作为一家专注于AI影像处理领域科研和应用的巨头公司,大觥科技也在采用颠覆性的技术用于老旧照片修复、画质增强等业务,旗下针对C端用户应用的“你我当年”(国内)、“Remini” APP(海外),在很多国家和地区都是热门的“现象级”应用。为了提高服务质量,满足日处理图片量 500万+、日处理视频量 20000秒+需求,该公司采用AWS Gravition2化繁为简、降低总体成本。

  “在2020年初,因为业务增长快速增长,导致企业没有更多算力,AWS解决了燃眉之急,提升了整个架构支撑能力。” 大觥科技副总裁袁泉表示,为了给前端应用提供更好的灵活度,不让前端设计受到图片大小的影响,公司需要做一个动态获取缩略图的服务。通过EC2搭建的缩略图服务器集群,公司简化了系统架构,提升了性价比。C6g在性能上提升了30%,在成本上节约了38%。

  计算无处不在

  众所周知,计算服务是AWS公司的核心能力,Amazon EC2从诞生之日起就有一个重要使命,那就是服务云上的所有工作负载。目前,EC2已服务于各行各业,提供的实例类型已接近400种,被全球几百万客户广泛使用,真正让计算做到了无处不在。从早期的数据库、ERP到后来以移动互联网、机器学习为核心的工作负载,都有EC2的身影。

  “未来,计算实例也会走量体裁衣这个路线,更偏定制化和规模化。” AWS大中华区云服务产品管理总经理 顾凡表示,虽然EC2已足够强大,但并不代表计算能力已停止创新,当用户对云计算需求在不断更新迭代,AWS也在不断挑战极限,创造新的可能。

  所谓的“量体裁衣”,要有目的、有市场、有客户需求;另外最重要的一点是,你能否做得出来。很多企业都在提供弹性计算,但在深度和广度方面,AWS真正做到了业界领先。AWS的计算实例支持所有的操作系统,包括Linux、Windows以及Mac OS;在处理器方面,支持x86、AMD、ARM,并且AWS是唯一一个有ARM计算实例的提供商,可提供针对不同客户需求的解决方案,可以分为计算密集型、内存密集型、存储、IO敏感、吞吐敏感、网络延迟等应用。

  在弹性计算层面,AWS一直在做成本优化,成本优化不是简单的降价,而是在技术改进基础上进行优化,这种优化也是创新。从最早的按需选择,到预留的实例,到Spot,再到Savings Plans,最后可以做到80%,甚至90%的成本节约。

  而在处理器层面,AWS跟英特尔、AMD、英伟达、赛灵思都有有合作。AWS和Intel有着长达14年的深度战略合作,做了很多定制化实例。比如:C5N,是可支持100G网络带宽的专有实例,到今天已升级到400G。再比如:SAP HANA这种大内存应用,借助AWS和Intel的合作,可提供最大24TB大内存的实例。除了Intel,AWS和AMD也是深度合作关系,无论是Naples还是Rome,两款处理器AWS都支持。AWS最新推出的Graviton2是云计算平台里第一款支持ARM处理器的实例,同时这款处理器也是一款企业级应用的ARM处理器。

  计算无处不在,创新永无止境。而在AWS所有创新中,最具亮点的部分,是AWS自研的芯片。2013年,AWS开始跟Annapurna labs合作,做第一代的Nitro。2015年,Amazon收购了Annapurna labs,变成了属于自己的一个半导体设计公司,由此揭开了半导体芯片研发旅程。2017年,AWS对外宣布第三代Nitro芯片和Nitro系统诞生。到2020年,AWS已经在使用第四代Nitro芯片的Nitro系统,作为AWS所有计算实例的基础。有了Nitro系统作为云服务器虚拟化的公共平台,可以大大加速AWS推出新的计算实例,不断丰富实例类型。

  AWS Nitro成为业界领先的云服务器虚拟化引擎,它包括AWS在硬件和软件两方面的创新。硬件方面,AWS设计一个Nitro卡,提供网络、存储、管理、安全和监控的功能,实现多租户隔离、私有网络和快速的本地存储,实现高效、灵活、安全的云实例交付。软件方面,AWS设计了一个非常轻量级的虚拟化管理程序。由于Nitro卡分担了相当大部分的虚拟化管理工作,AWS Nitro虚拟化管理程序占用物理服务器的系统资源非常小,通常不到1%;也就是说,将99%以上的物理服务器性能都交给客户,而传统的Hypervisor会占用大约30%的系统资源。

  另外,AWS针对机器学习领域,推出两个典型的工作负载。一个是推理,在2019年推出了AWS Inferentia专门用于推理的芯片,2020年已经有很多客户在使用;另一个是专门为训练的工作负载,AWS在2020的re:Invent上又一次宣布,将在2021年推出自己研制的专门为训练的工作负载设计的AWS Trainium的芯片。

  除此之外,AWS在CPU方面也在持续投入和研究。2018年的时候,AWS第一次对外推出了基于ARM架构的Graviton第一代CPU的芯片。在2019年的re:Invent,AWS宣布了第二代。到2020年,也有很多客户开始使用了Graviton2。

  AWS持续不断的创新,让更多用户看到并体验到无处不在的计算,这应该是我们曾经想象中的场景,“纳云于内,触手可及”。

0
相关文章