当开源遇上生成式AI,将碰撞出怎样的火花?红帽公司给出的答案是,通过小模型策略打通AI落地最后一公里难题!
如何理解“小模型”?
“虽然AI基础架构已迈过初步构建阶段,但投入产出比依然存在差距。很多企业对AI寄予厚望,但在实际应用层面,仍面临诸多挑战,许多预期的应用场景尚未真正落地。” 红帽全球副总裁兼大中华区总裁曹衡康(Victor Tsao)在接受媒体采访时表示,主推小模型并不是突发奇想,而是结合现实的AI环境,做出的一种更接地气的战略决策。
更进一步的理解是,红帽之所以宣布“小模型”部署路线,是客户需求在推动。走大模型热潮掀起之后,一些领先企业曾尝试通过构建大模型来提升效能,但在实际操作中却发现,大模型在生产环境中往往难以胜任。因为即便是微小的错误,也可能带来巨大的风险,这对于追求稳定性和安全性的企业来说,无疑难以接受。此种背景下,红帽在过去几年中提出了“小模型”的概念。
从字面意义来理解,“小模型”是相对大模型而言,是指相对参数较小的深度学习模型,同时结构也相对简单,比较容易部署。红帽眼中的“小模型”,是指专属模型(faithful purpose),这种模型的核心在于,让企业数据驱动AI模型生成,从而确保模型能够稳定、安全地运行,并完全符合企业的特定需求。这也是红帽选择与IBM合作的重要原因之一。通过双方的共同努力,红帽架构不仅支持开源模型,还兼容闭源模型,为企业提供了更为灵活的选择空间。除了专属模型外,红帽还推出了“社区版”小模型,这一创新之举进一步降低了AI应用对真实数据的依赖。通过合成数据技术,红帽成功地将数据量降至原来的千分之一,从而大幅减少了算力需求、降低了总体成本,包括在能源消耗和环境保护方面产生了更为积极的影响。
需要明确的一点是,红帽的关注点其实不只是模型本身,还有模型背后的企业自主性、安全性、创新速度、兼容性等关键能力。比如:在基础架构层面,红帽采用了混合云模式,这一模式不仅支持本地数据中心和公有云的运行,还兼容边缘计算环境,为企业提供了更为灵活的AI模型部署方案。这意味着,企业可以根据自己的实际需求,选择最适合的部署方式,从而实现AI应用的最大效益。而在场景应用方面,红帽引入了“开放实验室”概念。通过与客户的顾问团队合作,红帽针对企业的研发、生产、市场行销和客户支持等各个环节,进行深入的分析和探讨,共同找出最具效能的应用场景。通过这种“联合共创”的方式,企业可以从一个小应用开始,逐步积累经验,扩大应用范围,最终实现AI在企业各个领域的全面渗透和深度融合。
西门子的“小模型”探索
“我们早已在生产领域广泛应用了小模型技术,特别是在机器视觉方面。” 西门子工业自动化(成都)有限公司信息技术部经理杨健,对红帽提供的技术能力给与了高度评价。
作为一家致力于数字化转型的工厂,西门子深知AI、数据及技术平台的重要性,并已将这些前沿技术深度融入生产流程中,以显著提升生产效率与产品质量。在实际业务探索过程中,企业通过众多创新方法与平台,提升整体竞争力。特别是在集中化管理领域,资源的统一部署、方案的整合以及架构的优化方面,与红帽展开了深层次的合作。
小模型在生产环境中的优势显而易见,其针对单一应用场景进行优化,错误率低,能够确保生产质量与过程的可控性。以垃圾分拣为例,原材料加工后产生的废弃物中包含了金属、塑料、纸张等多种材质。过去,西门子的机器人视觉识别准确率仅为85%左右,这无疑限制了分拣效率的提升。但得益于小模型的应用,西门子基于开源的OpenCV框架进行了深度训练,成功将识别准确率提升至95%以上,这一显著的进步极大地提高了生产效率与资源利用率。
为什么是选择了小模型,而不是大模型?杨健进一步解释道,尽管大模型在某些场景下展现出了强大的性能,但也不得不正视其可能带来的风险,如“幻觉现象”等。在生产环境中,任何微小的错误都可能引发严重的后果,因此,企业在大模型的应用上持谨慎态度,希望通过持续的技术优化与验证,使其更加可靠、可信且全面。红帽提供的众多平台与解决方案,为西门子的未来发展提供了宝贵的参考意见,全面打开了企业的新视野。最终,在不断学习与实践过程中,西门子已经能够很好地驾驭AI技术,推动数字化工厂的持续发展与创新。
“AI三部曲”推进应用加快落地
从实际业务部署现状来看,生成式AI虽然是企业拥抱未来的新趋势,但所消耗的算力让很多用户望而生畏。说白了,大模型落应用才只是刚刚开始,企业对AI的投入非常谨慎。
为了打开用户心结,降低投资风险,红帽采取了“三步走”策略:
第一,轻松试用,无门槛探索。为了让客户能够无负担地体验开源模型与工具的潜力,红帽提供了极低门槛的试用方式。客户可以在最小资源配置下试用开源模型和工具,比如:在笔记本电脑上用CPU试跑,而不需要额外购置昂贵的GPU卡这一设计不仅降低了客户的初期投入成本,还极大地简化了操作复杂度,使得技术探索变得更加自由与便捷。
第二,云端扩展,灵活验证。当客户对初步试用结果感到满意时,便可无缝过渡到第二步——通过云租用算力进行更深入的验证与扩展。红帽平台的广泛兼容性使得它几乎能在任何云环境中运行,无论是公司内部的数据中心还是外部的公有云资源,客户都能根据自己的实际需求灵活选择。
第三,跨云部署,实现 最 佳 ROI。红帽架构支持跨云混合部署,为客户提供前所未有的灵活性与经济性。
从轻松试用到云端扩展,再到跨云部署。开源与AI正在形成合力,为客户提供一条既高效又经济的技术探索与落地路径。可以说,红帽如今所走的每一步,都旨在降低门槛、提升效率,最终助力客户在激烈的市场竞争中脱颖而出。