云计算·大数据 频道

当大模型开启人工智能未来十年,金山云凭全栈能力积极入局

  在过去一年里,大模型浪潮席卷全球,让人工智能迎来下一个黄金十年。当各种大模型、基础模型遍地开花,以金山云为代表的公有云厂商凭借底层、平台层以及应用层浑然一体的天然优势,在这片蓝海市场中占据了有利地位。

  ▲金山云副总裁 钱一峰

  “我们有典型的应用场景,比如:金山办公WPS等,还有很多知名的大模型厂商,都选择部署在金山云上。” 关于云+人工智能的未来发展,金山云副总裁钱一峰对记者如是说。

  那么,在这场“百模”甚至“千模”大战中,金山云要扮演的角色是什么?围绕通用大模型、行业大模型等不同赛道,如何快速切入市场?在底层技术栈的支撑能力上,如何以差异化优势赢得客户?关于这一连串问题,我们可以用几个关键字来概括,那就是“中立”、“行业模型”和“混合云”。

  1、 中立

  面对令人眼花缭乱的各种模型,金山云首先表明自己的态度,那就是围绕中立路线,打造大模型全栈服务能力。

  至于,金山云为什么要保持中立路线?在诸模混战中,如何规划更具战略性的大模型技术蓝图,才能抢占未来?金山云公有云产品中心负责人孙晓,首先从产品战略层面分析了大模型的发展现状!

  从大模型的生产到落地,中间涉及各种能力,不同层面都有不同的玩家。整体来看,可以划分为三层:第一层,模型层。这一层主要是模型直接催生出来的厂商,包括大模型厂商、行业模型厂商、场景模型厂商。第二层,平台层。主要包括大模型训练平台服务商、云服务商、MaaS平台服务商。第三层,基础服务层。比如:基础设施服务商、算力服务商、网络服务商、超算中心服务商。

  正是上述这些玩家组合在一起,才构成了大模型的百花齐放,让应用落地成为可能。此种背景下,不同层面的厂商,面临着不同挑战。比如:顶层的大模型厂商,花大量算力训练出来的模型文件不能被竞争对手获取,所以模型本身的安全性成为企业关注的重点。同时,从用户应用的角度看,企业私密数据是核心资产,当应用爆发,被大量终端用户使用,用户的隐私数据如何有效管理?更确切地说,作为一家云厂商,如何既满足上层大模型厂商的模型使用需求,同时还能将自己的算力和其他基础能力赋能给这些模型厂商用户?这是一个值得深入思考的问题!

  另外,上层大模型厂商大部分是初创型公司,他们更关心当前所使用的数据的基础架构是否具备跨云迁移能力。所以,安全、可靠和跨平台迁移的基础设施能力,是企业关注的另一个重要能力!

  整体来看,大模型带来的底层的技术变化是,除了传统的IaaS和PaaS,会催生出超越之前的算力、网络、硬件和数据中心能力。而中间面向大模型的平台层,会以更松耦合的方式支撑上层应用。同时,层与层之间基本以接口的方式去支撑应用,让用户不被任何一家厂商绑定,真正按需选择。

  此种背景下,金山云的战略定位也就变得越发清晰。首先,金山云的立场非常坚定,那就是严守中立,做大模型的助力者。其次,在技术能力上,要提供从训练到推理的全流程云服务。

  值得一提的是,保持中立不是一个“口号”,金山云的中立产品理念会以技术可监测的形式嵌入模型相关服务中,比如:通过使用日志提供可接入、可审计的能力。

  2、 行业模型

  问题是,既然金山云要保持中立,为什么还在规划推出自己的行业模型“金山云轻舟智问”?

  “我们不做通用大模型,但要想进行企业应用落地,甚至去支持整个平台,一定要在行业模型上需要从头到尾去进行探索。” 金山云人工智能与大数据产品中心负责人徐寅斐强调。

  简单理解,金山云轻舟智问主攻行业模型,只面向工时价值高的特定领域,或者说只做和自己目前业务相关的特定领域,比如:法律、金融、公共服务。

  具体而言,金山云轻舟智问的全场景能力可以用 “一三一四”来概括,谐音梗是“一生一世”。“一”,是一套能力,即给用户提供端到端的一套知识问答能力,可以以产品形态对外输出,也可以通过一些元素化能力为客户服务。“三”,对应三个模型,包括行业语言模型、文本分片和Embedding。还有一个“一”,是一个平台,即金山云瀚海平台。最后的“四”,是四大功能,包括与模型训练相关的微调推理、数据加速,还有应用层的输出,主要是智能检索和文档智能。

  为了做好企业知识助手,金山云基于上述几大核心能力,一直在苦练内功。比如:面对结构化、非结构化数据,如何进行统一解析和索引构建?这是一个浩大的工程,需要多模态解析和提取能力,而金山云自研的KDM则很好地满足了用户需求。再比如:智能检索,这是金山云基于售后场景慢慢成长出来的能力,可以帮助用户更精准地检索到想要的知识。以高性能云盘为例,ESSD分四个档位,每个档位都有不同的IOPS和吞吐能力。如果用户在某一场景中需要500M的写入吞吐,如何匹配适合的云盘?如果系统是简单的语义匹配,会去文档库搜索推荐云盘,最后搜索出一堆和结果无关的内容。但如果有更精确的智能推荐能力,会模拟人的操作步骤,首先会搜索ESSD有哪些产品规格,然后对用户的意图进行识别,对问题进行改写,并且会把问题拆成多步,然后再对比用户的实际性能需求和产品规格,给出相应的推荐。

  经过过去一年的努力,金山云围绕MaaS互信推理专区方案升级技术和产品,解决了模型厂商和应用厂商之间的互信问题。

  在去年发布的MaaS 1.0基础上,MaaS互信推理专区2.0方案更加强大,它以金山云IaaS和PaaS为底座,可实现云上LangChain的一键部署,默认对接多个生态合作商业大模型和开源大模型。同时,支持包括BGE、Bert等在内的Embedding模型,能无缝对接金山云全托管向量数据库Milvus,提供面向企业开发者的简单易用、安全可信的一站式推理应用部署平台。此外,MaaS 2.0支持通过标准化的API接口和Web前端界面,实现包括模型推理和知识库搭建的RAG大模型场景应用。为进一步增强云上运行的安全性,MaaS 2.0还提供容器服务加密镜像解决方案,依托金山云裸金属服务,实现在金山云容器服务中从镜像加密、加密镜像上传、解密镜像运行的全流程模型安全运行。

  3、 混合云

  AIGC浪潮不仅带来了各种模型的快速发展,也让底层的算力、存储、数据库等能力全面升级。2023年,金山云的核心产品一直在持续演进,比如:发布了第七代云主机、操作系统迁移到欧拉的内核上、EBS块存储已经发展到4.0的ESSD极速云盘、推出负载均衡新品ALB、对象存储推出了基于全闪介质的KS3极速型产品……

  而混合云是金山云基于过去底层能力进化出来的能力,也是另一个强项,既可做到物理隔离,又能拥有整个公有云的产品阵列。凭借全栈的底层基础设施管理能力,金山云可以通过混合云能力帮助用户打通自建IDC和公有云服务之间的壁垒。

  金山云把云算力网络分为三层,重点关注网络规模、网络带宽和网络稳定性几大能力。而在相对重要的底层,会有自研的IB/RoCE等服务方案,以及相关的可靠交付工具。同时,在服务器端还有Agent,具有整个链路的探测能力,可以做全网的性能测试,这对交付来说非常重要。

  用户通过金山云可以获得更具弹性的云上构建能力,不仅可以保持云下独立,又能享受云上规模的红利。其中,在基础资源方面的体验是,兼顾客户使用场景,支持多资源形态混合管理。在云上能力输出方面的体现是,可以让客户在云下使用云上产品技术,拓展云上产品的场景化能力。

  基于以上能力,金山云在2024年会基于大模型场景深化拓展,秉承中立原则,继续聚焦围绕核心能力实现自我提升,同时跟合作伙伴携手帮助更多企业实现智能化升级!

  小结:

  走过2023年大模型元年,2024年将进入人工智能原生应用爆发年,推理需求会暴涨,而金山云则会严守中立定位,凭借在基础能力和行业实践方面的积累拥抱人工智能,做大模型的助力者。

0
相关文章