如今,数据中心可谓是数字经济的基础。每一条微博动态、微信消息和抖音视频上传都依赖于数据中心。没有数据中心,就不会有网友追更的网剧、日常导航的地图和便捷的移动支付,各类药物的研发工作也将明显放慢脚步。尽管数据中心对于我们今天生活的世界至关重要,但它们的运行也不能够与环境的可持续发展相向而行。日前,《中国环境报》刊文指出,2021年全国数据中心能源消耗达到2166亿千瓦时,较2020年增加44%,约占全年总用电量2.6%,也相当于2021年湖南全省的用电量,且能耗增速高于数据中心机架增长速度。同时,也有预测显示,2025年中国数据中心耗电将占社会总用电量4%。因此,数据中心的绿色转型和节能减排具有十分重要的意义。
一般情况下,数据中心的节能可以通过适度调高环境温度、及时淘汰陈旧设施、虚拟化技术的应用,以及充分利用自然散热等方式实现。这些方式大多把算力需求带来的电力负荷作为刚性负荷,把焦点集中在供能系统等非服务器设备,重点关注配置储能、优化供冷系统调节等。而细观数据中心用电结构就会发现,服务器才是耗电“大户”,以PUE(Power Usage Effectiveness,数据中心总能耗/IT设备能耗)值为1.3的数据中心为例,服务器耗电占比77%。因此,寻找调节服务器的算力和电力负荷的方式,将能发挥出数据中心的巨大电力灵活性潜力。在近日举行的2022腾讯数字生态大会上,腾讯表示其正携手英特尔,基于英特尔® 数据中心管理平台(Intel® Data Center Management, Intel® DCM),对绿色数据中心需求侧响应进行深入研究。
所谓电力需求响应,指的是通过判断计算任务在服务器上的算力-电力特征,在不影响业务运行的情况下,降低电力部件的实时冗余性、调整业务负载的并行规模和时间分布,达到降低、平移、伸缩数据中心服务器的用电负荷,形成“算力跟随电力”的特性,从而实现节能降耗、对电网负荷削峰填谷等目的。
为此,腾讯已与英特尔等合作伙伴对三种策略进行了探索,其中包括利用空载服务器功耗切换、利用服务器硬件资源消耗不均衡性,以及平移和伸缩实时性不敏感任务的方案。具体来说,第一种方案利用了数据中心中部分服务器处于并未执行任何工作而空载备用的现实,通过业务规模的精细预测,对服务器执行不同方式的功率降低和休眠策略,可实现不同级别的响应速度和响应深度,使其成为数据中心节能的重要途径。测试数据显示通过切换服务器空载状态,三种模式皆可获得功率降低。其中,Freeze、PowerCap皆可秒级响应,功率降比分别为4%、27%;关机带来的功率降低最大,最高可达100%。
相比于利用空载服务器功耗切换,第二种方式则通过研究一系列的特性数据,寻找导致性能使用密集的子部件及因此产生能力冗余的其余部件,通过降低冗余的子部件性能,可以在不影响业务负载运行效率的情况下,降低电力负荷。测试数据显示,在执行硬盘密集型任务时,可将CPU 功率由215 W压缩至160W,降比达26%。而在执行内存密集型任务时,内存占用越高,CPU功率可压缩空间则越大。
最后,第三种方式针对日益增长的高性能计算需求及具有计算成本敏感、实时性不敏感、计算规模可变动特性的工作负载,对并行算法和并行软件设计加以改良。一方面通过实时传递价格信号,激励用户选择电力价格较低的时间段进行整体运算;另一方面,通过断点续算、可续渲染技术,在计算任务执行的过程中暂停乃至对并行规模进行改变,来平移和升降电力负荷。各类型并行计算的测试结果表明,缩容、扩容、平移等计算节奏调整虽然不会显著影响总耗电量和总时长,但这一策略可根据电网响应邀约时段和负荷调节要求,灵活改变算力分布,达到“削峰填谷”的目的。
在数字经济快速发展、社会能源消耗节节攀升的今天,上述研究无疑为绿色数据中心的建设与可持续发展的未来指明了新的方向。这不仅是腾讯碳中和规划中的重要一环,也将作为重要科技成果,在本月底的联合国气候变化大会上进行展示。
作为云计算产业生态的非常好的合伙人,英特尔与腾讯的“牵手”并未止步于此——在2022腾讯数字生态大会上,腾讯也正式了发布基于第四代英特尔®至强®可扩展处理器(代号Sapphire Rapids)的第七代云服务器实例S7/M7。这也是继腾讯云星星海自研四路服务器和腾讯云星星海 XC221 计算型服务器之后,双方携手在数据中心服务器领域带来的又一重磅升级。
得益于第四代英特尔®至强®可扩展处理器的强劲算力,该全新云实例实现了较高的性能提升。而在腾讯云星星海自研服务器与银杉自研智能网卡的加持下,S7/M7也实现了性能、安全和可靠性的全面增强。英特尔与腾讯在这一实例上的合作不仅将持续提升云产品性能,也通过软硬协同推进的方式实现算力成本优化,助力客户应用降本增效,为进一步打造兼备高性能和高可用特性的优质云服务奠定了坚实基础。
此外,在混合云解决方案领域,基于英特尔®至强®可扩展处理器、系统集成芯片(SoC)和FPGA,以及英特尔®傲腾™持久内存的新一代腾讯云TCE一体机实现了针对计算、网络、存储与监控运维的全面升级;在SaaS、视频与AI、数据服务以及云原生等领域的多个产品线上,双方全栈式的软硬件合作助力腾讯云实现了针对云上推荐系统、矩阵乘、机器视觉、语音过滤以及自然语言模型(BERT)的全方位AI优化;而基于第四代英特尔®至强®可扩展处理器的AMX-VNNI指令集,腾讯云得以大幅提升视频增强性能,优化视频前处理和转码速度并极大降低运维成本……
当今时代,有人把云计算技术视为个人电脑、互联网之后的第三次革新浪潮,认为它即将甚至已经从根本上改变整个信息产业的格局,改变人类使用计算机的习惯和方式,因此,云计算技术得到了迅猛发展。在短短15年内,全球整体云计算市场规模从零增长到2021年的7050亿美元。这样的发展不仅从日益增长的行业与社会需求中汲取动能,更离不开如腾讯与英特尔的长期投入与坚定创新。中国作为全球云计算市场中增长最快的区域,伴随着老朋友与新伙伴的持续合作和不断壮大的产业生态,也必将迎来下一个更加蓬勃的发展期。