云计算·大数据 频道

从红帽OpenShift看虚拟化在AI时代的革新与进化

  谈到虚拟化与AI基础设施构建这一话题,想到前几天看到的一篇很有意思的文章,标题叫做《操作系统知道自己是在虚拟机中运行的吗》。同样的道理,有些人可能会感到意外,支撑AI模型训练和推理的底层算力,也可以是虚拟化。

  所谓 “AI一天,人间一年”,当大模型推动算力需求呈指数级增长,不仅让通用计算走向智算新阶段,还带来了底层算力的差异化选择问题。为了支持资源的大规模部署,很多企业通过分布式计算与云计算结合的方式,实现资源的调度优化和混合云/多云管理,即企业通过Kubernetes等框架实现跨节点算力调度,支持大规模训练与推理。但从实际AI技术栈的部署现状来看,也有不少企业还没有实现容器化部署,依然按照传统方式在开发AI应用。这时候,企业需要按照传统方式提供算力需求,这也是红帽依然在推OpenShift虚拟化方案的根本原因,虚拟化依然有发展空间。

  虚拟化在AI时代的探索

  在人工智能与容器化技术深刻变革企业IT架构的当下,虚拟化技术正经历着从传统资源池化向智能化演进的关键期。

  针对尚未容器化的AI工作负载,红帽虚拟化通过快速部署虚拟机(VM)为传统开发模式提供标准化运行环境,确保非容器化应用无缝接入现代化架构。红帽的虚拟化技术方案是构建在红帽的容器化产品OpenShift基础上的,因此OpenShift Virtualization继承了OpenShift的核心技术。OpenShift虚拟化的运行依赖于已经迭代了近20年的Linux KVM,成熟度与稳定性与VMware技术相当。在兼容性方面,从OpenShift Virtualization诞生之时就已经非常良好。随着使用范围的不断扩大,针对OpenShift Virtualization的兼容情况会越来越好。在存储方面,OpenShift Virtualization支持目前流行的几乎所有存储,尤其是通过CSI Driver的存储产品。由于OpenShift Virtualization继承了OpenShift的生态,所以可以支撑多种平台。尤其是最近一年,支持的平台数量明显增加,包括主流的公有云厂商及众多的硬件厂商产品。

  具体而言,OpenShift Virtualization可以基于KVM的弹性扩展能力,实现计算资源的按需分配。例如在AI推理场景中,系统可根据实时负载自动扩容GPU实例,在训练任务完成后释放闲置资源,优化TCO。更重要的是,OpenShift Virtualization可以充当一个容器化“过渡桥梁”的作用,企业可以将虚拟机与容器化应用统一管理,为后续迁移至Serverless架构提供渐进式路径。

  后VMware时代的技术突围路径

  显然,AI时代底层基础设施的主力虽然是容器;但短期内,虚拟化依然是算力的“重要基座”。

  在Red Hat Summit 2025媒体分享会上,红帽透露了一个重要数据。自2024年初以来,红帽OpenShift虚拟化客户增长势头强劲 ,增长了3倍。究其原因,外部环境变化是最大推动力。博通收购VMware后,很多企业不得不重新考虑虚拟化平台选型的问题,这给红帽虚拟化方案在市场上的增长带来了新的机会。另一个增长动力是公司内部的推动,红帽公司从2020年下半年开始就在大力推动OpenShift Virtualization的采用,在众多客户中进行技术探索。经过几年的发展,OpenShift Virtualization的功能、特性已经非常完善,完全可以替代当前其它厂商的虚拟化平台产品,用户的广泛接受成就了这部分业务的高速增长。

  当然,从长远来看,AI技术栈的核心一定是容器化和云原生。因为,虚拟化技术已经足够成熟,不可能再有更大发展。随着容器化的推进,虚拟化应用会逐步过渡到容器化,容器化平台上的应用会逐渐增加,这个过程可能会持续很长时间,如果非要加上一个期限,时间周期可能会是5年或者更长时间。

  而在虚拟化到容器化转变过程中,如果企业需要维护虚拟化、容器化两个平台,会带来运维成本的上升。红帽的虚拟化平台构建于容器化平台产品OpenShift之上,因此该平台同时能够支持虚拟化技术和容器化技术,把原本需要两个技术平台实现的功能,在一个平台上统一实现了,极大地缩减了总体成本,降低了技术的复杂度。

  从资源供给到智能运维

  任何工作负载、任何应用,任何地方……在红帽自由、开放理念的支撑下,OpenShift虚拟化未来依然会继续精进。除了与Oracle数据库、Oracle RAC等产品集成,支持最新的AMD EPYC处理器,红帽还在规划新的方向。

  首先,与云原生深度集成。将虚拟机纳入Kubernetes调度体系,实现VM与Pod的混合编排,更好地适配容器化的管理运维等场景;

  其次,加速生态扩张。虚拟化平台需要与硬件服务器、存储等众多厂商双向认证,确保虚拟化的众多功能特性可用;

  其三,AI驱动运维。增强易用性,方便用户与自有开发的运维管理系统集成,实现虚拟机及其资源的自动化调整;

  其四,加大可视化功能部署。开发3D拓扑视图,将虚拟机性能指标信息实时映射至数字孪生界面,提升可视化能力。

  结语:

  整体来看,在AI发展浪潮的推动下,虚拟化正迎来转型关键期。但目前来说,虚拟化技术非但未被淘汰,反而通过与云原生的深度融合获得新生。红帽在虚拟化产品的策略,为更多企业带来了新技术路径的选择。未来五年,企业需要的不是虚拟化与容器化的二选一,而是能够统一管理异构工作负载、兼容新旧技术栈、具备自主进化能力的智能平台。当博通收购引发的市场震荡逐渐平息,红帽正以“容器原生虚拟化”的独特定位,重新定义企业数字基础设施的下一阶段标准。这场变革说明,真正的技术革新不在于颠覆过去,而在于构建连接现在与未来的桥梁。

0
相关文章