近年来,尽管公有云提供商在人工智能(AI)领域投入了大量资源,但它们的努力似乎并未完全达到预期目标。这一现象在Microsoft最近的财报电话会议中得到了体现,尽管公司积极推动AI发展,并对基础设施进行了巨额投资,但增长数据却未能满足市场期望。首席执行官萨蒂亚·纳德拉在解释这一缺口时,揭示了一个令人深思的企业生存现状:传统的公有云模式在兑现生成式AI的承诺方面正面临严峻挑战。
实际上,这一挑战已存在数月之久。公有云提供商在试图将现有的云计算产品应用于AI工作负载时,遇到了根本性的架构不匹配问题。传统的公有云基础设施主要是为通用计算工作负载设计的,这些工作负载在过去十年中一直占据着主导地位。然而,AI工作负载却截然不同,它们需要专门的硬件配置、海量的数据吞吐量和复杂的编排功能。因此,当企业在传统云基础设施上扩展其AI计划时,往往会遇到不可预测的成本、性能瓶颈和基础设施限制,从而阻碍了持续增长。
这种不匹配在以下两个关键方面表现得尤为明显:
一、适用于传统应用程序的定价模型在应用于AI工作负载时变得异常昂贵。
许多企业在运行大型语言模型或训练复杂AI系统时,发现云费用急剧上升,而商业价值却并未成正比增长。高昂的云账单让企业陷入了恐慌,担心AI系统的部署会耗尽IT预算。
二、公有云基础设施本身并未针对AI应用程序的密集、持续计算需求进行优化。
适用于运行Web应用程序或数据库的方法,并不适用于现代AI工作负载。这种不匹配导致了性能瓶颈和资源浪费,进一步加剧了企业的成本压力。
面对这一挑战,越来越多的企业开始探索替代方案,如私有AI基础设施和混合解决方案。他们发现,公有云中部署简单、可扩展AI的承诺往往伴随着隐藏的复杂性和成本,使得增长变得难以实现。因此,公有云提供商需要认识到AI需要采用不同的方法来处理基础设施、定价和服务交付。当前的收费模式对于大多数企业来说是不可持续的,他们正在转向非云替代方案。
那么,在这样的背景下,企业应该如何应对呢?
一种明智的做法是采用混合策略。这种策略结合了公有云资源的敏捷性与私有基础设施的控制力,为企业在AI领域的发展提供了更加灵活和高效的选择。企业可以利用公有云进行突发实验和创新,同时将专门的AI基础设施用于资源密集型工作负载,以实现最 佳性能和成本控制。
此外,成本管理也是企业不可忽视的重要因素。财务团队应密切监控云费用,利用先进的工具实时跟踪使用情况,并分析总拥有成本。通过深入了解预留实例和承诺使用折扣等选项,企业可以为其可预测的AI工作负载选择最经济的解决方案。
同时,企业还需要对其基础设施需求进行全面评估。他们应该明确哪些工作负载真正需要云可扩展性,哪些可以在专用硬件上高效运行。通过投资专门的AI加速器等技术手段,企业可以在成本和性能之间找到适当的平衡。
降低风险也是企业制定AI战略时不可忽视的一环。为了防止供应商锁定,领导者应确保应用程序保持可移植性,并掌握容器编排等关键技术。同时,他们还需要在数据架构中保持灵活性,以便根据业务需求进行调整和优化。
总之,随着AI技术的不断发展,企业在公有云领域面临的挑战日益凸显。然而,通过采用混合策略、加强成本管理、全面评估基础设施需求以及降低风险等措施,企业可以克服这些挑战,在AI驱动的世界中取得成功。这是一段充满挑战和机遇的旅程,只有那些正确驾驭云策略的企业才能把握住AI带来的创新力量,进而实现持续增长。