当前位置:首页 > 科技资讯 > 正文

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新

全球领先的云计算巨头再次强化其人工智能武器库,迎来一系列突破性更新!

据智东西从拉斯维加斯发回的现场报道,12月2日,在年度云计算产业盛会AWS re:Invent上,亚马逊云科技(AWS)连续发布多款重量级AI新产品,涵盖最新AI芯片Trainium4、基于其首款3纳米AI芯片打造的Amazon EC2 Trainium3 UltraServers、第二代自研大模型系列Amazon Nova 2,以及众多智能体开发工具

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第1张

从AI基础架构、AI推理平台、企业数据管理到智能体开发套件和前沿智能体应用,整体迎来全面升级。智东西作为受邀前线参与的媒体,从大会现场带来详细深度报道。

Amazon Nova 2系列首次推出四款模型:经济高效的推理模型Lite,高智能推理模型Pro,支持语音转语音的实时拟人对话式AI模型Sonic,以及面向多模态推理和图像生成的统一模型Omni

其中,Nova 2.0 Pro Preview在指令跟随、智能体工具使用等基准测试中,性能表现超越了GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview等当前前沿模型。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第2张

值得注意的是,Amazon Bedrock平台新增了18款全托管开源模型,其中包括4款来自国内的顶尖模型:阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第3张

其他新增的前沿模型还包括谷歌Gemma 3、英伟达Nemotron、OpenAI gpt-oss-safeguard、Mistral AI的Mistral Large 3和Ministral 3等。

整体而言,本次大会的十大重要发布涵盖:

1、P6e新实例:采用英伟达GB300 NVL72系统。

2、AWS AI Factories服务:专为客户定制的AI基础设施,由AWS快速构建和管理。

3、AWS Trainium4自研AI芯片:第四代自研AI芯片,相比上一代提供6倍的计算性能(FP4)、3倍的FP8性能、4倍的内存带宽、2倍的内存容量,并支持通过NVLink Fusion和UALink实现纵向扩展。

4、Amazon EC2 Trainium3 UltraServers:由AWS首款3纳米AI芯片Trainium3驱动,为大规模AI训练和推理提供高性价比,单集群可连接144张Trainium3芯片,算力高达362PFLOPS(FP8),带宽为706TB/s,相较上一代带来4.4倍计算性能、3.9倍高内存带宽、5倍的每百万瓦token处理能力。

5、Amazon Bedrock平台:新增18款开源模型,平台模型数量在过去一年实现翻倍增长,已拥有超过10万客户,其中50多家客户的token使用量均超过1万亿。

6、Amazon Nova 2系列自研模型:包括Lite、Pro、Sonic、Omni。

7、Amazon Nova Forge服务:支持企业访问Nova模型在不同训练阶段的检查点,并将自有数据与亚马逊的训练数据集融合,构建定制化的前沿模型。

8、AgentCore开发工具:Policy in AgentCore(预览版),通过细粒度权限策略为智能体行动设定明确边界;AgentCore Evaluations(预览版),利用评估器根据现实世界行为持续检查智能体质量。

9、4款前沿智能体:AWS Transform Custom(专为企业开发工作流程设计),Kiro autonomous agent(自主处理复杂编程任务)、AWS Security Agent(预览版,保护全开发生命周期安全)、AWS DevOps Agent(预览版,加速事件响应并提升系统可靠性)。

10、7款新实例、6项Amazon S3存储升级、5项Amazon RDS数据库更新、3项计算与加速优化新功能、4项管理与治理新功能。

01.新基建:全新AI芯片Trainium4性能飙升6倍,助力企业定制专属AI基础设施

亚马逊云科技CEO马特·加曼(Matt Garman)表示,亚马逊云科技是首家在云中提供英伟达GPU的公司,与英伟达的合作已超过15年,也是目前运行GPU集群规模最大的企业。

1、基于英伟达GB300 NVL72打造P6e-GB300

今天,亚马逊云科技新发布采用英伟达最新GB300 NVL72系统的P6e-GB300实例,相比P6e-GB200,新实例的GPU内存容量提升至1.5倍,FP4计算性能(无稀疏)提升至1.5倍。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第4张

英伟达在亚马逊云科技上运行其生成式AI集群。OpenAI同样在亚马逊云科技上基于EC2 UltraServers集群支撑ChatGPT的运行及下一代模型的训练,部署了数十万张GB200。加曼透露这些处理器即将升级为GB300。

本月初,亚马逊云科技还与沙特阿拉伯AI创企Humain建立合作,计划在沙特的数据中心设施中提供、部署和管理最多15万个AI加速器。

2、AWS AI Factories满足企业私有化部署需求

为满足企业的私有化部署需求,亚马逊云科技今日推出AWS AI Factories服务。基于此平台,客户可在自己的数据中心部署专用AI基础设施,并享用亚马逊云科技的基础设施和服务。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第5张

3、Amazon EC2 Trainium3 UltraServers

目前,Amazon Bedrock上运行的所有推理工具均由Trainium芯片提供支持,亚马逊云科技已部署了100万颗Trainium芯片,Trainium2的量产速度是此前芯片的4倍。

加曼称,亚马逊云科技的Trainium系列芯片虽以“训练”命名,但也适用于推理场景。目前,亚马逊云科技上的许多AI推理服务都在Trainium芯片上运行,包括Claude的前沿模型。

亚马逊云科技还围绕Trainium打造了一个超大规模系统,名为Project Rainier用于训练Anthropic的下一代Claude模型

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第6张

这一项目的规模极为庞大,加曼表示,如果说单个数据中心已成为新的计算机,那么Project Rainier则更进一步,让由多个数据中心组成的园区构成了一台超级计算机。

Project Rainier将持续扩展,最终支持多达30个单体数据中心,消耗1.1GW电力,托管超过50万个Trainium2芯片。相关计算设备将使用超过100万个高速连接器件,通过AWS EFA网络实现安全可靠的连接。

亚马逊云科技于去年发布了Trainium3芯片,今日,加曼宣布Amazon EC2 Trn3 UltraServers服务器已广泛可用。与上一代产品相比,该服务器可提供4.4倍的算力和3.9倍的内存带宽。

值得注意的是,Amazon EC2 Trn3 UltraSevers在能效比上也显著提升,每兆瓦所处理的token数量达到前代产品的5倍。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第7张

4、下一代AI芯片Trainium4

加曼还透露,亚马逊云科技的下一代AI芯片Trainium4已进入深入设计阶段。Trainium4预计将提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量,并支持通过NVLink Fusion和UALink进行扩展。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第8张

02.新模型:阿里、Kimi、MiniMax模型上架,第二代自研模型Nova 2四款齐发

亚马逊云科技Amazon Bedrock推理平台已拥有超过10万客户,使用其处理超1万亿个token的企业客户已超过50家。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第9张

亚马逊云科技一贯秉持“选择至关重要(Choice Matters)”的理念,这也体现在模型选择上。加曼称,AI的未来不会由单一模型主导,过去一年,Amazon Bedrock上提供的模型数量已翻倍,DeepSeek、Qwen等中国模型也已纳入支持范围。

Amazon Bedrock今日新增18款全托管开源模型,包括Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2等中国模型。此外,谷歌Gemma、英伟达Nemotron以及全新的Mistral Large 3和Ministral 3(3B、8B和14B版本)等模型也已登陆Amazon Bedrock平台。

亚马逊云科技还发布了第二代自研模型家族Nova 2系列,推出4款新模型:Lite、Pro、Sonic和Omni。

Nova 2 Lite是一款快速且经济高效的推理模型,适用于多种工作负载,具备良好的指令遵循、工具调用、信息提取、代码生成等能力。Nova 2 Lite在上述四大领域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模型,仅在编程能力上略逊于GPT-5 mini。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第10张

Nova 2 Pro是Nova系列中最智能的推理模型,支持文字、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的工作负载,尤其是智能体场景。在两项智能体基准测试中,其表现已超过GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Nova 2 Sonic是亚马逊云科技的下一代语音转语音模型,支持文本和语音两个模态的输入输出,能为AI应用提供实时、类人的对话式AI体验。在语音理解和推理任务上,其性能已超过GPT Realtime、Gemini 2.5 Flash等。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第11张

Nova 2 Omni是Nova系列的新成员,也是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。不过,亚马逊云科技尚未公布其基准测试成绩。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第12张

03.新服务:开放Nova模型训练检查点,助力企业训练专属前沿模型

加曼谈到,AI需要具备理解公司数据的能力,才能为公司及客户创造巨大价值。

由于数据的独特性,企业通常不希望自己的专有数据被嵌入第三方模型供他人使用。过去,业内让企业数据与模型结合常用技术是RAG或向量数据库,但这无法让模型真正理解数据。要教会模型理解行业知识,仍需定制模型。

然而,从零开始定制模型成本极高,企业往往缺乏足够数据和算力来构建强大的通用智能。

若在开源模型基础上通过微调、强化学习等方式打造行业模型,则可能面临其他领域性能下降的风险。

亚马逊云科技的解决方案是Amazon Nova Forge。Nova Forge引入了“开放式训练模型(Open Training Model)”概念。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第13张

通过Nova Forge,企业可以独家访问各种Nova模型的训练检查点,并在模型训练的任意阶段,将自己的专有数据与亚马逊创建的训练数据集混合。这使得企业能够产出深度理解自身信息的模型,同时不会遗忘模型已训练的核心知识。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第14张

Nova Forge还提供了使用远程奖励函数和强化学习微调的能力,以进一步改进模型,让企业可以将真实环境集成到训练循环中。由于基础模型已理解业务,这些后训练技术实际上会变得更加有效。

亚马逊云科技已与多家企业试点了Nova Forge服务。索尼便通过Nova Forge对Nova 2 Lite模型进行了微调,使其适配自身业务和运营。模型在引用一致性和文档依据等任务上表现优于基准模型,索尼的目标是借此将合规审查和评估流程效率提升100倍。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第15张

04.新工具:为智能体开发设定边界和评估标准

今日,亚马逊云科技宣布Amazon Bedrock AgentCore新增两项新功能,助力开发者快速构建智能体。自AgentCore SDK预览版发布以来,其5个月内下载量已超过200万次。

此前,亚马逊推出了为智能体设计的核心工具集AgentCore,包含部署、代码解释器、托管环境等多种能力。在此基础上,亚马逊推出Policy in AgentCore预览版和AgentCore Evaluation预览版。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第16张

Policy in AgentCore允许开发者在AgentCore Gateway工具调用运行前进行拦截,使用带有细粒度权限的策略为智能体行为定义明确界限,如指定可使用哪些工具、如何使用工具,开发者也可通过自然语言创建标准,例如“当报销金额大于1000美元时,阻止退款操作”等。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第17张

AgentCore Evaluations是一项全托管服务,帮助开发者持续监控和分析基于真实行为的智能体表现。开发者可使用内置评估器衡量常见质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可创建基于模型的定制评分系统,根据自选提示和模型进行业务定制评分。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第18张

所有AgentCore的评估结果均会在亚马逊统一监控平台CloudWatch呈现。开发者还可设置评估分数的警报和通知,主动监控智能体质量,并在指标超出可接受阈值时作出响应。

亚马逊此前构建了Amazon QuickAmazon Connect两个智能体方案。

首先是Amazon Quick,可帮助员工在几分钟内将想法转化为行动,指导深度研究并获取详尽分析,其能从获取信息中整理出详细研究报告;员工还可创建小型智能体,协助处理日常重复性工作。几周前,亚马逊在公司内部发布了Amazon Quick,目前其已拥有数十万用户。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第19张

其次是Amazon Connect,加曼谈到亚马逊内部税务团队的案例,该团队创建了一个智能体,帮助汇聚所有税务数据来源、深入研究税法政策变化。该智能体的另一应用场景是客户服务,可将AI引入企业的联络中心。

05.新智能体:加速开发、优化编程、保障安全、增强可靠性

加曼认为,对于试图快速现代化其应用程序的开发团队而言,当前最大痛点之一是处理技术债。在美国,技术债务每年给企业造成总计2.4万亿美元的损失,如今70%的IT预算用于维护遗留系统。

此前,亚马逊云科技已推出AWS Transform,通过AI实现转换流程的降本增效。在此基础上,AWS今日推出AWS Transform Custom,这一智能体帮助用户创建自定义代码转换智能体,以实现任何代码、API、框架、运行时或编程语言的翻译和现代化。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第20张

例如,全球知名ERP软件公司QAD使用AWS Transform,将原本至少需要两周才能完成的转换项目压缩至3天。

今年早些时候,亚马逊云科技发布了面向专业开发者的AI IDE“Kiro”。加曼称,已有数十万开发者在使用Kiro,有开发者感叹,使用Kiro后,过去5个月内交付的代码量超过过去10年。上周,亚马逊已将Kiro定为公司官方AI开发环境。

为进一步加强开发流程的自动化程度,亚马逊云科技发布了三款全新的前沿智能体,使Kiro在自主性、大规模可扩展和长期运行等领域的表现进一步提升。

Kiro Autonomous Agent是一个与开发工作流并行运行的自主开发智能体。它如同团队的一名额外成员,能独立处理复杂任务,让工程师专注于核心创意。开发者只需指派一个复杂的目标导向任务,它能自行规划、分解并执行所有必要步骤,直至交付可用代码。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第21张

这一智能体还会越用越智能,能长期深度理解代码库、团队规范和过往决策,从每次互动中学习,形成“集体记忆”,并将所学知识应用到后续任务中。

AWS Security Agent是一个持续、主动、内置的AI安全专家。它能在设计阶段主动审查文档,确保安全性;在编程过程中扫描代码漏洞,并直接集成到GitHub PR中,为开发者提供即时、可操作的修复建议。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第22张

这一智能体还能将渗透测试自动化,将传统昂贵且周期长的渗透测试转变为可按需启动、快速完成的自动化持续验证过程。

AWS DevOps Agent将运维工作自动化,能自动诊断并修复问题。当警报触发时,DevOps Agent会立即自动响应,诊断问题的根本原因,提供修改意见和方案,并交由工程师审查批准。

06.新实例、新存储、新数据库、新加速、管理与治理

加曼最后用10分钟公布了25项新发布。

AWS re:Invent 2025:AI基础设施、模型与智能体工具全面革新  Trainium4 Amazon Nova 2 Agent开发 第23张

7款新实例:搭载第五代AMD EPYC处理器的X8i Instances,内存增加超50%;搭载第五代AMD EPYC处理器的X8aedz Instances,计算性能是前一代X2iezn实例的两倍;搭载第五代AMD EPYC处理器的C8a Instances,性能提升30%,性价比提升19%;搭载英特尔至强6的C8ine Instances,每个vCPU的数据包性能可比上一代C6in实例提升2.5倍;搭载第五代AMD EPYC处理器的M8azn Instances,计算性能是上一代M5zn实例的2倍。

还有两款采用最新苹果硬件的新实例:EC2 M3 Ultra Mac InstancesEC2 M4 Max Mac Instances。

面向开发者,亚马逊云科技推出Lambda durable functions(持久函数),开发者可利用内置的自动恢复功能构建长期运行的工作负载。

存储方面,包括将S3最大对象大小从5TB提高至50TB,增加10倍;亚马逊S3的数据管理功能S3 Batch Operations更新,在200亿个对象的规模下,完成作业的速度提升10倍;为S3 Tables提供智能分层,节省80%存储成本;S3 Tables支持AWS区域和账户间自动复制扩展Amazon S3接入点,支持Amazon FSx for NetApp ONTAP;用于存储和查询向量的对象存储S3 Vectors全面上市利用GPU提升向量索引构建效率,速度提升10倍,成本仅需1/4。

计算与加速优化新功能,Amazon EMR Serverless提供Amazon EMR on EKS,允许用户在不预先配置或管理存储的情况下运行大数据工作负载。

Amazon RDS数据库的更新包括:RDS for Oracle和RDS for SQL Server扩展存储容量RDS for SQL Server的CPU优化选项对SQL Server开发者版本的支持,以及数据库节省计划

管理与治理相关的新发布包括:为ECS和EC2新增GuardDuty扩展威胁检测功能提供近乎实时分析及风险优先级排序功能的Security Hub安全中心CloudWatch统一数据管理和分析功能

07.结语:智能体开发已成加速创新的大势所趋

在主题演讲中,加曼多次强调智能体的重要性:智能体是企业从AI投资中获得实质性商业回报的关键。而为智能体系统及应用开发构建新模块,需要性能更强的AI基础设施、推理平台、企业数据、构建和部署智能体的工具。

智能体可自主感知业务需求并依据需求智能适配业务流程、动态调整执行策略,高效匹配业务场景的核心诉求,已成为释放AI价值的重要载体。亚马逊云科技在扩展加速计算产品线的同时,亦在不断优化智能体开发和部署工具,推出满足开发者多元化工作负载需求的新平台、新工具。

据加曼回顾,今年第三财季,亚马逊云科技的年化收入已达1320亿美元,同比增长超20%。

过去一年,亚马逊云科技增加了3.8GW数据中心容量。如今,亚马逊云科技拥有全球规模最大、部署最广泛的AI云基础设施,全球数据中心网络覆盖38个地区、120个可用性区域,还宣布再增加3个地区。

亚马逊云科技已与全球顶尖的大模型公司建立合作,在其平台陆续上架全球主流开源模型,下一步的重点显然是帮助更多客户将智能体落地到真实业务中,产生更广泛的商业价值。