新年伊始,万象更新。回顾过去一年发展,智算云市场如火如荼,大大小小的企业都在发力。作为云与AI融合发展的厂商代表,金山云凭借全栈能力布局,在2025年迎来高光时刻。
“当大模型得以快速发展,进入规模化应用阶段,金山云的智算服务体系带动了存储、网络、数据清洗等一系列周边业务的增长。” 金山云高级副总裁刘涛,在2025金山云年度Tech Talk上表示。不难预测,在智算云业务的带动下,公司整体业绩表现不俗,未来增强的潜力巨大。
面对生成式AI浪潮,智算服务市场在发生着微妙变化,新型算力成为支撑大模型训练和推理需求的重要载体。国际数据公司IDC发布的报告显示:2024年上半年,中国智算服务市场同比增长79.6%,市场规模已达到146.1亿元人民币。这说明,智能算力在AI生态系统中已占据核心地位,算力基础设施将迎来规模化增长期。
放眼市场,在技术发展和行业应用双引擎驱动下,来自各个层面的企业都在布局智算服务,其中既有公有云厂商、大型运营商,也有传统的IDC厂商。金山云能够脱颖而出,凭借的是多年的技术积累和高瞻远瞩的战略决策能力。
智算云平台化发展之路
虽然,智算云在这两年呈现高速发展状态,但对于金山云来说,AI能力的构建并不是从零开始,而是从公司成立时就在积蓄力量。在服务企业客户的过程中,金山云积累了很多经验,在基础云、智算网、智算平台等方面,具备了成熟的技术支撑能力。
在刘涛看来,所谓智算服务并不是服务器和高性能网络的直接连接,而是需要结合实际生产场景进行一系列优化,比如:如何让高性能网络稳定运行,如何让高性能的文件存储满足客户需求,如何能在大规模、低成本的存储和高性能存储之间找到最 佳平衡点,如何解决任务调度和故障自愈问题等等,需要平台化以及工程化的能力,才能构建出真正的智算服务体系。
金山云助理总裁、公有云产品研发中心负责人孙晓认为,智算云2.0时代,需要以平台化以及Severless能力满足用户对高效以及低成本诉求。此种背景下,金山云通过整合软硬一体化能力,对计算、存储、网络进行全面升级,以高性能基础设施能力支撑智算云的发展。
面对2.0时代,金山云要基于整个平台为用户提供任务式交付。比如:针对训练场景,用户不需要从底层开始去做资源的拉通,更不需要关心组网、监测、异构算力的管理等问题,而是直接让用户专注自己的业务。另外,Serverless也是智算云的一个关键能力。因为,对云客户来说,Serverless是一个足够友好的状态,可以让用户关心自己的业务网络,为实际业务负载去付费。在2.0时代,Serverless能力会带来加分项,将与平台化能力形成组合拳,让用户在大模型构建过程中,完成从数据准备到生产再到应用的全生命周期过程。
全技术栈协同联动为AI发展铺路架桥
从应用体验来看,用户在金山云上看到的是一个放心、高效、低成本的大模型平台,可一站式满足训、推、用各类需求,但底层是一个全面进化的智能云服务体系在支撑。
具体而言,金山云的智算服务体系具备全栈技术能力。
金山云的智算云架构图规划包括智算平台、智算网和异构资源管理的专属层。其中,平台层主要围绕数据平台、训练平台、推理平台及存储平台进行智算平台整体能力建设,确保大模型平台构建客户拥有易用、稳定的平台支撑能力。而在相对底层的智算网优化方面,金山云不仅提供多种组网架构,还通过自研的RoCE网络监控平台为运维人员提供全面且直观的网络视图,最终通过算力平台更加合理地分配和利用资源,确保业务的连续性。同时,为了帮助用户应对数据处理挑战,金山云在服务层整合了服务器、云网络、容器及高性能对象存储在内的能力,包括通过使用Serverless Spark在内的多款Serverless形态数据类产品,满足用户资源弹性以及业务敏捷性需求。
在行业模型方面,用金山云助理总裁、AI产品研发中心负责人徐寅裴的话来说,金山云对于AI的关注点在于,以行业模型为中心,去构建模型平台多应用视角的全技术栈能力,满足垂直领域客户的数智化转型需求。目前,距离客户比较近的应用是金山云轻舟行业大模型,可助力法律、政务和金融等客户实现从语言模型到多模态模型的构建。另外,用户还可以通过金山云瀚海平台去对接模型控制、大规模分布式训练等诸多原子能力。
随着金山云生成式AI生态的不断成熟,生态能力也在不断拓展,可满足用户对特定业务场景的需求。以金山云已与信永中和集团的合作为例,双方将构建一个集大模型训练推理、应用开发、长效运营能力于一体的一站式平台,打造“大数据+人工智能”双轮驱动的闭环能力,为有需求的用户提供一站式服务。
写在最后
致力于ToB场景,实现AII In AI目标。不管是得益于大模型的发展,还是雷系业务推动下的结果,金山云智能云的快速发展,是诸多云计算厂商智变的一个缩影。相信,随着大模型的发展,随着智算云的规模化扩张,中国AI产业的智能化变革将迎来关键节点。