在大模型赛道,“开源”与“闭源”的选择,一直是一个很有意思的话题点!
有些企业,做着做着开源就变成闭源了,比如:Meta暂停Llama模型“Behemoth”的测试工作,集中资源开发闭源模型;有些企业做着做着闭源,中途却又改道开源,比如: OpenAI 在今年开源了 GPT-oss 模型;还有一些企业,开源和闭源“两条腿”走路,比如:谷歌、微软、阿里、腾讯等大厂,既有开源模型,又有闭源模型。
到底选择开源?闭源?还是都选?本质上,都可以归为是战略选择问题。不管是哪种方式,技术路线本身没有对错。从性能追赶来看,开源与闭源的界限正在变得模糊,开源模型的性能正在逼近闭源模型,阿里的Qwen3、DeepSeek的R1等开源模型已与Claude 4、GPT-4.1等闭源模型比肩,甚至实现反超。从模型能力来看,多模态、强化推理和MoE架构等几个关键技术能力,正在推动AI应用的加速落地。
在技术发展呈螺旋式上升过程中,开源AI给世界发展带来的推动作用,有目共睹。不管是Meta的Llama系列、Stability AI的Stable Diffusion,还是DeepSeek的发布……这些大模型之所以能快速“破圈”,是因为他们带来了技术普惠的“飞轮效应”,让全球开发者在集体智慧之上,再上新台阶。
开源,不仅大幅降低了人工智能的技术门槛,更以强大的协同效应倒逼行业加快创新步伐,推动整个生态进入高速迭代的新阶段。注意,这个“生态”不只是模型应用层,还包括模型的开发、部署,数据和算力的管理等AI Infra层面的改变。
为进一步推进开源AI 生态的繁荣发展,弘扬开放、协作共享的创新精神,ITPUB在【IT风向标】系列直播活动中,特别邀请 了AI 领域两位重磅专家,共同探讨开源 AI 的现状、挑战与未来趋势。一位是红帽亚太 CTO 办公室首席架构师张家驹;另一位是Zilliz的合伙人&研发VP栾小凡。两位嘉宾一致认为,开源与闭源之间,从来就不是“非黑即白”的选择。
当DeepSeek用开源挑战巨头,当等大厂们既拥抱开源又保留闭源,当企业用户在安全与成本间做出适合自己的选择,我们看到的是——一个正在重构的AI生态。
在过去一年里,中国开源AI表现出强劲发展势头。一份源自The Atom Project的全球模型追踪数据显示,2025年10月中国开源模型的下载量攀升至约5.5亿次,美国同类产品为4.75亿次。一家评测机构指出,评分最高的10个开源模型中有8个来自中国,而且未来中国的领先优势还将扩大。
在开源AI繁荣发展的背后,也面临着一些挑战,诸如:信任度、开放性,还有盈利能力等。那么,问题来了,在消灭技术边界这场“战争”中,到底哪些地方存在“槽点”或者“卡点”?很明显,安全问题是第一个挑战!
01
开源AI可信吗?
开源是把“双刃剑”,当开发者获得开放透明的代码,意味着所有人对你的应用了如指掌,很容易被植入恶意代码,使得私域数据被公开。外加Cursor、Claude封禁API等事件,都在加剧这种不信任感。
尤其是企业级应用场景,安全是“生命线”,没有半点退让的可能!那么,就模型应用而言,到底是开源更安全,还是闭源更安全?
“使用闭源API,整个应用是个黑盒,一旦出现问题,你对数据安全无法把控。既然这样,那是不是要把企业数据都拿出去?开源模型又会面临新的安全隐患!” 栾小凡指出,企业应用通常会面临两难处境。
与模型发展不相匹配的是,使用开源模型还有一个巨大的“鸿沟”,我们没有一个“Benchmark “可以像评测模型一样,去评估模型本身的安全性。“模型投毒”已成为一个事实威胁,如果用户在预训练时掺杂了恶意数据,在评估过程中没有被及时发现,会对产出结果产生很大影响。
所以,大模型被推出后,很多企业更愿意以私有化的方式去部署。在这一过程中,模型本身是否开源似乎不再那么重要。当然,针对“模型投毒”这样的问题,即便是私有化部署,也只能解决部分问题。
“当模型能力逐渐同质化,推理引擎(vLLM、SGLang)、RAG框架、向量数据库(如Zilliz)、路由分发系统才是开源的真正主场,这又落回到了传统意义上的基础设施层面,” 张家驹发现,在私有化场景,基础设施的成熟度、稳定性和易用性,反而成为了决定AI落地的关键因素,而不在于是否开源,重要的是整个基础设施是建立在开源生态之上。
从这个角度来看,开源AI是否可信,就落脚到更细分的维度。一个是数据敏感程度,核心业务数据是否允许出域;另一个是技术能力储备,是否有能力维护私有化部署;最后,是合规性,要能满足行业监管对透明性的要求。
张家驹还揭示了一个令人尴尬的现象,在当前环境下,完全开放的开源模型的创新优势似乎并不像想象中的那么明显。但长远看,真正的开源一定是闭源模型的最有力补充。
02
如何看待“开放权重”模型?
拥抱开源AI虽然是大趋势,但在技术路线部署上,会有分叉,也会有趋同!
“开源的魅力在于,你可以站在巨人的肩膀上看世界,能基于别人的代码去做修改。但现在的开放权重模型,本质上别人很难再做创新。”
张家驹提出了一个尖锐问题:这种“非全过程开源”,真的能带来传统开源软件的创新红利吗?红帽怀揣着一个乌托邦式的梦想:从数据准备、模型训练到持续迭代,全过程开源。这才是真正的“技术平权”!然而,“理想很丰满,现实却很骨感”,现在的主流开源模式,更多是开放权重,而非全过程开源。
新趋势背后,是一个略显悲观的判断。栾小凡认为,造成这种现象的根本原因是,“大模型发展到现在可能进入到一个瓶颈期。未来,我们会看到越来越多的微创新出现,至于下一个Scaling law在哪里?目前我们还没有看到!”
目前,开源AI正处在艰难的过渡期。当下的“开放权重”模式,或许是一种必要的妥协。既让更多人能够使用先进AI技术,又保护了开发者的商业利益。更多人的目标,是一个“卖铲子”的逻辑,希望通过模型去吸引用户。尤其是一些大厂和云厂商,可以通过开源带生态,推动硬件或者云资源的使用。
对比来看,开源AI其实和互联网的发展脉络一样,从只有巨头玩得起的“大机时代”,到走向人人可参与的“PC时代”,还需要技术的持续突破和成本的不断下降。正如张家驹所说:“随着时间推移,也许会有变化。当技术门槛足够低,当算力成本足够亲民,真正的开源AI时代才会到来。”
从长远发展来看,当训练和推理成本在模型部署中占“大头”,开源的优势将更加明显,我们会看到越来越多更好用的开源模型。
03
开源商业化,背后逻辑是什么?
开源不等于免费!当开源遇上AI,一个来自灵魂深处的发问索绕心头——那就是这玩意到底怎么赚钱?当大厂们纷纷拥抱开源,当创业公司在开源道路上艰难前行,商业化成为了最现实的考验。
放眼市场,栾小凡直言不讳地指出了开源AI商业化的两条路径:
第一条路,“挂羊头卖狗肉”。开源本身不直接赚钱,但能拉动其他业务。
以云厂商的开源模式为例,做模型这件事情并不挣钱,但是能拉动云资源的使用,并且未来还会是一个很大的“盘子”。
同样,一些硬件企业也是这种“套路”,比如:英伟达就是这条路径的典型代表。无论是推理框架,还是大家耳熟能详的Triton、TensorRT核心AI加速工具,所有动作,本质上都在帮他解决同一个问题:卖卡。
英伟达的这套逻辑在于,把软件堆栈做好,最终通过软件带动硬件销售。在这个游戏里,开源是手段,硬件销售才是目的。
第二条路,开源产品本身商业化。根植于生态,通过托管服务和企业级支持变现。
这种“打法”的差异点在于,开源产品本身其实就是为了去吸引更多用户,把开源生态打磨好,吸引一部分不想自己去维护复杂工程体系的用户,或者对稳定性有更高要求的用户。
比如:向量数据库技术的开创者Zilliz,不仅拥有全球最受欢迎的开源向量数据库Milvus,还推出了基于 Milvus 的全托管云服务 Zilliz Cloud,这是一条基于开源产品构建云平台体系的成熟路线,已经得到Databricks、MongoDB等知名企业的可行性验证。
与上述路线不同的是,作为开源界的“老兵”,红帽的生存哲学,只有一条,那就是做好“脏活苦活累活”。
“软件的价值不仅仅是闭源软件提供的license,还包括你在使用过程中的一系列后续问题,包括用户需要的补丁、安全更新、问题处理、技术培训,这些价值也需要有人来提供。”
让广泛使用的开源软件在企业生产场景中用好,红帽用这套模式打造了三大产品线,包括Linux操作系统、OpenShift容器云平台和Ansible自动化工具。如今,为了满足AI这种“新型工作负载”,红帽又在努力让K8S更好地支持AI,包括在推理引擎社区上进行大力投入。
远离光环,贴近地面。在开源路线战略布局过程中,红帽只选择做“关键贡献者”,只贡献“20%-30%”,但能为最终用户提供100%的支持服务。如果一家企业开源贡献是100%,那非常容易走着走着就闭源;但如果你的开源贡献是0,那在别人的潜意识里,你就是一个集成商,根本没有深度服务的能力。所以,红帽只做关键贡献,把精力放在可能遇到的各种问题上,虽然做了很多 “苦力活”,但这种务实的理念,却也探索出一条开源商业化的正确路径。
04
结语
展望未来,开源AI的发展,将是一个分裂而繁荣的生态。
分裂体现在技术栈的分层:底层基础设施几乎完全开源,上层应用百花齐放;小模型开源,大模型闭源;通用能力开源,专属能力闭源。
就AI Infra而言,开源的前景一片光明。这种信心来自于开源独特的反馈循环——更多的用户使用,更多的反馈汇聚,更快的产品迭代。这种来自真实场景的反馈,成为AI基础设施不断进化的燃料。从向量数据库到推理框架,从训练调度到Agent开发工具,开源正在重演Linux时代的胜利。
这或许就是AI时代最朴素的真理——技术路线会变迁,商业模式会演化,但为用户创造价值的能力,才是真正的“杀手锏”。