每年的re:Invent,像是全球云计算领域的“科技春晚”,也是未来一年技术走向的“风向标”,而紧随其后的re:Invent中国行,则更像是一场精心设计的中国企业看世界的一个“窗口”,它将远在拉斯维加斯的前沿蓝图,进行解码、翻译,然后投射到中国企业的“数字化战场”上,真正解决企业在实际业务场景中遇到的难题。
那么,问题来了,刚刚落幕的re:Invent 2025,为这个世界描绘了怎样一幅新图景?其中有哪些重磅发布,令人印象深刻?如果用一句话概括,答案毫无异议——AI Agent是统领一切技术创新的关键词!
“Agent已经为各行各业的客户带来了价值,能够将创新的效率提升10倍,未来会有数十亿甚至更多Agent去改善业务,提升生活。要做到这一点,需要突破基础设施的可能性极限、为搭建Agent系统提供强大的工具,以及重新想象每个流程和所有工作方式。” 亚马逊云科技大中华区产品总经理陈晓建,在re:Invent中国行专场分享中表示,围绕Agent的创新已不止停留在单一的概念阶段,而是贯穿了从底层芯片到模型平台再到顶层应用的一整套生态能力。
AI基础设施全面升级
如今,云计算的竞争已不只是模型上的比拼,还有AI基础设施的全面进化。在这场核心技术升维“战役”中,亚马逊云科技正在构建一个多维部署的“算力堡垒”。
为了把定义未来的“钥匙”掌握在自己的手中,亚马逊云科技一直在打造Amazon Trainium自研芯片家族。现在,部署超过100万片的Amazon Trainium已进化到第三代,最新升级的产品属于业界首个3纳米AI芯片。而相比前一代产品,基于三代Trainium打造的Amazon EC2 Trn3 UltraServers服务器在计算能力上提升4.4倍,内存带宽提升3.9倍,能效提升5倍。这背后除了工程化的创新,更是全栈能力优化带来的规模化效应。展望未来,已提上发布日程的Amazon Trainium4,会更具想象力,将全面引领AI算力时代。
除了自研芯片,亚马逊云科技正在打破“主权算力”边界,让那些拥有自有数据中心、受制于严格数据主权与合规要求的企业(如金融、政务、医疗巨头),也能获得最 先 进的AI能力,这就是Amazon AI Factories 这个最新发布带来的革命性意义。所谓“Amazon AI Factories ”,是指亚马逊云科技将一整套经过大规模验证的先进AI基础设施,包括从最新的英伟达GPU、自研Trainium芯片,到顶层的SageMaker和Bedrock平台,进行完整“封装”后,直接部署到客户的数据中心里,这是一个完全私有、独立运营,但能力与公有云同步的 “专属云区域”,让用户在确保私密属性的同时,也能部署最 先 进的AI基础设施与服务。
当然,如果用户有自己的选择,比如想通过英伟达的芯片来支撑自己的业务,亚马逊云科技也能提供相应的服务。亚马逊云科技与英伟达有超过15年的战略合作关系,基于英伟达最新GB300 NVL72系统的Amazon EC2 P6E实例,正是两家企业深度合作的成果体现,可为最苛刻的AI负载提供顶 级算力,就连英伟达公司自己也选择在亚马逊云科技上运行其内部最大的GPU集群“Project Ceiba”来进行研发。
很明显,从AI基础设施革新的角度来看,亚马逊云科技正在把AI算力比拼带向一个更高维度,那就是从单一的芯片性能对决,演变为涵盖芯片设计、大规模集群工程到全栈软件优化、混合部署乃至能效提升的“全能铁人赛”。亚马逊云科技在AI算力上的最新部署说明,未来最具领导力的公司不是拥有芯片最多的公司,而是以高效、最灵活的方式将底层能力组合在一起,服务于每一行AI代码的公司。
从平台到工具的多维创新
如果说基础设施是大家使用AI能力的其中一部分,还有一个最重要的能力不可或缺,那就是可以用于AI推理的模型服务平台。Amazon Bedrock就是这样一个安全的、可扩展的、功能丰富的AI平台,可以帮助客户快速构建生成式AI,把产品原型推向生产。
用户在Amazon Bedrock上不仅可以获得Amazon Nova系列模型(Lite、Pro、Sonic、Omni),还可以部署Google’s Gemma、KIMI、MiniMax M2和NVIDIA’s Nemotron等开源或者开放权重模型。同时,为了满足企业级多样化需求,亚马逊云科技还重磅发布了Amazon Bedrock RFT强化微调、Amazon SageMaker AI模型定制、Amazon SageMaker HyperPod无检查点训练,以及Amazon Nova Forgae等定制化模型方案。
除了模型平台能力支持,亚马逊云科技也在积极推动Agentic AI的加速落地,其中最大的动作就是Amazon Bedrock AgentCore的发布与持续更新。
“虽然Agent这个词听起来没变,但技术原理与去年有很大不同。去年大家容易把Assistant和Agent的概念混淆。但今年我们的很多发布代表Agent能够主动思考。当结果错误时,它会自我反思并形成循环,从接收指令到执行任务、调用系统操作,如果出错就反思重来。这正是Amazon Bedrock AgentCore提供给开发者构建Agent的逻辑。” 亚马逊云科技大中华区产品技术总监王晓野在媒体专访中强调,Amazon Bedrock AgentCore可以说带来了Agent应用开发的范式跃迁,你可以把它想象成是一个可以解决通用难题的 “智能体工厂操作系统”,可以推理和动态地创建工作流程,而不用担心复杂的模型调优、上文管理等问题。
具体而言,Amazon Bedrock AgentCore包含Runtime、Memory 、Identity等多种不同能力,可以帮助用户大规模和安全地去开发、部署、操作Agent。以记忆(Memory)与情境理解为例,智能体需要像人一样拥有“记忆”。AgentCore此次新增了episodic记忆功能,实现了了从短期会话到长期情景的完整记忆管理。假如一家公司需要构建一个用于差旅规划的智能体,如果能记住用户“上次因航班延误而错过重要会议”,就能在本次规划中主动优先选择准点率更高的航班。这种基于上下文的理解,是智能体产生质变的关键。
同样,Runtime这种安全的沙盒环境也是企业级Agent应用创新的“刚需”。当智能体被授权调用外部系统或执行代码时,安全隔离至关重要。AgentCore利用亚马逊云科技沉淀多年的底层能力,可以构建一个安全隔离的实时的运算环境,同时可以处理短时和长时间的Agent任务,让用户的在线需求实现自动扩容。
本次re:Invent大会上,Amazon Bedrock AgentCore还发布了两个最新特性:一个是Policy in Amazon Bedrock AgentCore;另一个是Amazon Bedrock AgentCore Evaluations。借助Policy,企业可以用自然语言的方式为Agent的操作设定清晰的边界。团队可以使用自然语言,通过定义Agent可访问的工具和数据、可执行的操作以及适用条件,为其划定具体范围。AgentCore Evaluations功能简化了原本复杂的评估流程,并免去了对评估基础设施的管理需求,提供13个预置评估器,覆盖正确性、实用性、工具选择准确性、安全性、目标达成率和上下文相关性等常见质量维度。开发团队可设置预警机制实现主动质量监控,评估功能可用于测试与生产阶段。。
只有平台服务还不够,为了构建消费极AI体验,亚马逊云科技还提供了Amazon Quick。这是一个可以整合企业所有数据源的应用,包括数据库、数据仓库或者第三方数据,让企业基于自己的数据和场景构建更接近业务的应用。Amazon Quick有很多独 一 无 二的功能,比如:Amazon Quick的Research(研究)、Insights(洞察)、Automation(自动化),通过多Agent的协作工作流,可以帮助企业完成一个复杂的任务。
亚马逊云科技在平台和工具层面的更新,对于广大企业而言,意义深远!这意味着,许多过去必须依赖稀缺高级技术人员、耗时数周才能完成的数据分析、系统集成或报告生成工作,现在可以通过智能体开发平台及工具实现自动化、规模化处理。这不仅是效率的提升,更是企业核心能力构成的重塑。
写在最后
AI Agent的兴起,标志着Agentic AI时代真正到来,人类专家的经验与判断力,正通过智能体无限复制和放大。作为 “数字化”的延伸,智能体可以不知疲倦地处理执行层的复杂任务,将人类的意图高效、精准地转化为现实。如果用一句话概括re:Invent的精髓,亚马逊云科技在AI基础设施、模型平台、工具以及上层应用的最新发布,让我们看到:AI Agent正加速重构企业应用开发新范式,而人的价值将更进一步聚焦于提出正确的问题、设定战略目标、做出价值判断,以及发挥创造力与同理心。在科技创新的聚光灯下,亚马逊云科技的诸多重磅发布,带来了一个明显的信号,未来的组织形态将是人类和智能体协作的共生体,只有能够驾驭这一新范式的企业,才能定义下一个十年的游戏规则。