云计算·大数据 频道

刚刚!亚马逊云科技宣布,推出Qwen3与DeepSeek-V3.1

  在大模型的世界里,隔三差五就祭出一个”王炸”,大家从“卷性能”到“卷价格”,充满了“火药味”。有没有一种可能,不同大模型之间是通力协作关系?用户只需登录一个平台,就能按需选择,覆盖不同的业务场景?这是亚马逊云科技从推出Amazon Bedrock之初,就在思考的问题,即从用户视角构建大模型应用范式,以达成用户模型选择的自由化。

  有了这个大前提,再来看亚马逊云科技宣布推出Qwen3与DeepSeek-V3.1模型的这种行为,便不难理解!

  把全世界最优秀的模型上架到Amazon Bedrock,对于亚马逊云科技来说是一件很平常的事情,这就是日常工作。但对于国产大模型来说,却具有划时代的意义。这不仅是一次技术服务的升级,更是AI普惠化的一大进步。基于Amazon Bedrock,国产大模型也有机会在世界的舞台上,打开一扇门。用户无需繁琐的部署,无需担忧安全、算力瓶颈,就可以通过全托管的方式,轻松调用模型和相关工具,并且融入企业的生产场景。

  可以说,是开源的力量让大模型从“竞争”走向“竞合”。从今天开始,Amazon Bedrock将正式上线通义千问Qwen3系列和DeepSeek V3.1两个领先的开放权重模型。此举将进一步丰富Amazon Bedrock的模型生态,为全球客户提供更广泛、更前沿的AI模型选择,助力企业高效构建和部署生成式AI应用。

  强化模型阵容:引入Qwen3与DeepSeek V3.1

  “我们已有中国客户在海外业务中使用Amazon Bedrock上的DeepSeek模型。此次引入更强大的Qwen3和DeepSeek V3.1,将进一步满足全球市场对高质量、多语言AI模型的需求。” 亚马逊云科技大中华区产品部总经理陈晓建(Erik)在媒体采访中强调,此次上线的Qwen3与DeepSeek V3.1将面向全球客户,部署在Amazon Bedrock的全球区域(如北美、欧洲、亚太等),而非中国区域。这一策略旨在服务全球开发者与企业,尤其支持中国客户的“出海”战略。

  反过来看,引入Qwen3与DeepSeek V3.1,对于亚马逊云科技来说,也是一件互惠互利的事情。Amazon Bedrock自推出以来,始终致力于聚合业界最 先进的基础模型,涵盖开源、开放权重及商业闭源等多种类型。目前,平台已集成来自Meta、Mistral AI、OpenAI、Anthropic等全球顶尖AI公司的数十个模型。此次新增的Qwen3与DeepSeek V3.1,将进一步巩固其在开放权重模型领域的领先地位。

  值得一提的是,Qwen3是一个包含多个子模型的系列,此次上线包括:

  Qwen3-Coder-480B-A3B-Instruct与 Qwen3-Coder-30B-A3B:专为软件开发场景优化,可辅助代码生成、调试与优化。

  Qwen-3-235B-A22B-Instruct-2507与 Qwen3-32B(Dense):通用推理模型,在性能与效率之间实现良好平衡,适用于多轮对话、复杂任务规划等场景。

  所有Qwen3模型均支持高达26.2万个Token的上下文长度,相当于20万汉字,可处理长篇文档、多轮会话等复杂任务。

  DeepSeek V3.1是继DeepSeekR1上线后的又一力作,是最新一代大模型,具备“混合推理能力”,提供“思考模式”与“非思考模式”两种运行方式:

  思考模式:适用于复杂推理、数学计算、逻辑推导等高难度任务。

  非思考模式:适用于快速响应的简单查询,提升效率并降低成本。

  该模型拥有685B参数,采用MoE(Mixture of Experts)架构,在保证高性能的同时,显著优化了算力利用率与推理成本,尤其适合智能体(Agent)开发、数据分析与多语言任务。

  面向全球客户,服务出海与全球化场景

  至于,为什么是开放权重模型?什么是“开放权重模型”?与“开源模型”有何区别?

  “市面上多数开源模型,实际上属于开放权重模型(Open-Weight Model)。”亚马逊云科技大中华区产品部技术总监王晓野,解释道:“目前真正完全开源的模型非常少。”

  开放权重模型:仅公开模型的参数权重,允许下载和使用,但不提供训练数据、训练代码或完整训练过程。

  开源模型:才是严格意义上的开源,应包含全部训练数据、代码、算法细节和实现过程,确保他人可完全复现。

  Qwen3和DeepSeek V3.1属于开放权重模型,亚马逊云科技在Amazon Bedrock上对其进行了企业级的安全与合规增强,确保客户可安全用于生产环境。

  Amazon Bedrock:不只是模型平台,更是生产级AI应用引擎

  需要重点强调的是,Amazon Bedrock并非简单的“模型API聚合平台”,而是一个为企业级生产环境打造的AI应用平台。其核心价值体现在以下三方面:

  1. 企业级安全与合规

  亚马逊云科技承诺,不保存、不共享客户的输入/输出数据,数据不会用于模型二次训练。

  为了确保数据安全,会提供端到端加密、严格的访问控制。同时,支持Guardrails功能,防止有害内容输出与模型“幻觉”。尤其是刚刚上线的自动推理检查(Automated Reasoning)功能,可进一步提升推理准确性。

  2. 工程化优化与高性能

  模型平台深度集成亚马逊自研芯片(如Trainium、Inferentia),在Token延迟、带宽等方面实现优化,提升性价比;确保托管模型性能与官方一致,无“减配版”,客户可获得最 佳推理效果;可以提供跨区域高可用架构,保障业务连续性,避免因底层故障导致服务中断。

  3. 丰富的生产级工具链

  通过Prompt Caching,可以缓存重复提示,显著降低Token消耗与成本,尤其适用于智能体开发;通过Knowledge Bases,可以接入私有数据,实现定制化问答与检索增强;通过微调(Fine-tuning)能力,可以支持客户基于自身数据定制模型;借助AgentCore,可以提供智能体开发所需的计算、存储、监控等底层能力。

  客户选择模型的三大考量:功能、性能、成本

  问题是,面对开放权重模型与商业闭源模型(如Claude、Nova),客户如何选择?陈晓建指出,客户决策主要基于功能、性能、成本三大维度。

  从功能上来看,Qwen3-Coder在代码生成上表现突出,DeepSeek V3.1在推理与数学任务中领先,而Claude在多模态处理上具优势。

  在性能上,开放权重模型与闭源模型的差距正在缩小,部分场景下已具备竞争力。

  至于,成本上,并非“开源一定便宜”。成本取决于模型规模、算力优化、调用方式等。例如,Amazon Nova Lite虽为闭源,但在翻译等场景下性价比极高。

  “客户不会只用一个模型。”陈晓建补充说到,“我们看到很多客户在同一产品中混合使用多个模型,例如对付费用户用高性能模型,对免费用户用轻量级模型。”

  未来展望:持续扩展模型生态,聚焦生产级能力

  亚马逊云科技坚持“没有一款模型能一统天下”的理念,将持续引入业界领先的模型,保持平台的多样性与中立性。

  当然,Amazon Bedrock的重点不是做"模型超市",而是帮助客户将模型真正用到生产中。未来,亚马逊云科技将继续强化平台在安全、高可用、成本优化和工具链上的能力,让客户专注于业务创新,而非底层复杂性。

  此次Qwen3与DeepSeek V3.1的上线,标志着Amazon Bedrock在支持中国AI创新成果全球化方面迈出关键一步,也彰显了亚马逊云科技持续为全球客户提供最前沿AI技术的坚定承诺。

0
相关文章