当前位置：首页 > 科技资讯 > 正文

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新

主机测评网
科技资讯
2026-01-31
144

全球领先的云计算巨头再次强化其人工智能武器库，迎来一系列突破性更新！

据智东西从拉斯维加斯发回的现场报道，12月2日，在年度云计算产业盛会AWS re:Invent上，亚马逊云科技（AWS）连续发布多款重量级AI新产品，涵盖最新AI芯片Trainium4、基于其首款3纳米AI芯片打造的Amazon EC2 Trainium3 UltraServers、第二代自研大模型系列Amazon Nova 2，以及众多智能体开发工具。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第1张

从AI基础架构、AI推理平台、企业数据管理到智能体开发套件和前沿智能体应用，整体迎来全面升级。智东西作为受邀前线参与的媒体，从大会现场带来详细深度报道。

Amazon Nova 2系列首次推出四款模型：经济高效的推理模型Lite，高智能推理模型Pro，支持语音转语音的实时拟人对话式AI模型Sonic，以及面向多模态推理和图像生成的统一模型Omni。

其中，Nova 2.0 Pro Preview在指令跟随、智能体工具使用等基准测试中，性能表现超越了GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview等当前前沿模型。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第2张

值得注意的是，Amazon Bedrock平台新增了18款全托管开源模型，其中包括4款来自国内的顶尖模型：阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第3张

其他新增的前沿模型还包括谷歌Gemma 3、英伟达Nemotron、OpenAI gpt-oss-safeguard、Mistral AI的Mistral Large 3和Ministral 3等。

整体而言，本次大会的十大重要发布涵盖：

1、P6e新实例：采用英伟达GB300 NVL72系统。

2、AWS AI Factories服务：专为客户定制的AI基础设施，由AWS快速构建和管理。

3、AWS Trainium4自研AI芯片：第四代自研AI芯片，相比上一代提供6倍的计算性能（FP4）、3倍的FP8性能、4倍的内存带宽、2倍的内存容量，并支持通过NVLink Fusion和UALink实现纵向扩展。

4、Amazon EC2 Trainium3 UltraServers：由AWS首款3纳米AI芯片Trainium3驱动，为大规模AI训练和推理提供高性价比，单集群可连接144张Trainium3芯片，算力高达362PFLOPS（FP8），带宽为706TB/s，相较上一代带来4.4倍计算性能、3.9倍高内存带宽、5倍的每百万瓦token处理能力。

5、Amazon Bedrock平台：新增18款开源模型，平台模型数量在过去一年实现翻倍增长，已拥有超过10万客户，其中50多家客户的token使用量均超过1万亿。

6、Amazon Nova 2系列自研模型：包括Lite、Pro、Sonic、Omni。

7、Amazon Nova Forge服务：支持企业访问Nova模型在不同训练阶段的检查点，并将自有数据与亚马逊的训练数据集融合，构建定制化的前沿模型。

8、AgentCore开发工具：Policy in AgentCore（预览版），通过细粒度权限策略为智能体行动设定明确边界；AgentCore Evaluations（预览版），利用评估器根据现实世界行为持续检查智能体质量。

9、4款前沿智能体：AWS Transform Custom（专为企业开发工作流程设计），Kiro autonomous agent（自主处理复杂编程任务）、AWS Security Agent（预览版，保护全开发生命周期安全）、AWS DevOps Agent（预览版，加速事件响应并提升系统可靠性）。

10、7款新实例、6项Amazon S3存储升级、5项Amazon RDS数据库更新、3项计算与加速优化新功能、4项管理与治理新功能。

01.新基建：全新AI芯片Trainium4性能飙升6倍，助力企业定制专属AI基础设施

亚马逊云科技CEO马特·加曼（Matt Garman）表示，亚马逊云科技是首家在云中提供英伟达GPU的公司，与英伟达的合作已超过15年，也是目前运行GPU集群规模最大的企业。

1、基于英伟达GB300 NVL72打造P6e-GB300

今天，亚马逊云科技新发布采用英伟达最新GB300 NVL72系统的P6e-GB300实例，相比P6e-GB200，新实例的GPU内存容量提升至1.5倍，FP4计算性能（无稀疏）提升至1.5倍。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第4张

英伟达在亚马逊云科技上运行其生成式AI集群。OpenAI同样在亚马逊云科技上基于EC2 UltraServers集群支撑ChatGPT的运行及下一代模型的训练，部署了数十万张GB200。加曼透露这些处理器即将升级为GB300。

本月初，亚马逊云科技还与沙特阿拉伯AI创企Humain建立合作，计划在沙特的数据中心设施中提供、部署和管理最多15万个AI加速器。

2、AWS AI Factories满足企业私有化部署需求

为满足企业的私有化部署需求，亚马逊云科技今日推出AWS AI Factories服务。基于此平台，客户可在自己的数据中心部署专用AI基础设施，并享用亚马逊云科技的基础设施和服务。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第5张

3、Amazon EC2 Trainium3 UltraServers

目前，Amazon Bedrock上运行的所有推理工具均由Trainium芯片提供支持，亚马逊云科技已部署了100万颗Trainium芯片，Trainium2的量产速度是此前芯片的4倍。

加曼称，亚马逊云科技的Trainium系列芯片虽以“训练”命名，但也适用于推理场景。目前，亚马逊云科技上的许多AI推理服务都在Trainium芯片上运行，包括Claude的前沿模型。

亚马逊云科技还围绕Trainium打造了一个超大规模系统，名为Project Rainier，用于训练Anthropic的下一代Claude模型。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第6张

这一项目的规模极为庞大，加曼表示，如果说单个数据中心已成为新的计算机，那么Project Rainier则更进一步，让由多个数据中心组成的园区构成了一台超级计算机。

Project Rainier将持续扩展，最终支持多达30个单体数据中心，消耗1.1GW电力，托管超过50万个Trainium2芯片。相关计算设备将使用超过100万个高速连接器件，通过AWS EFA网络实现安全可靠的连接。

亚马逊云科技于去年发布了Trainium3芯片，今日，加曼宣布Amazon EC2 Trn3 UltraServers服务器已广泛可用。与上一代产品相比，该服务器可提供4.4倍的算力和3.9倍的内存带宽。

值得注意的是，Amazon EC2 Trn3 UltraSevers在能效比上也显著提升，每兆瓦所处理的token数量达到前代产品的5倍。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第7张

4、下一代AI芯片Trainium4

加曼还透露，亚马逊云科技的下一代AI芯片Trainium4已进入深入设计阶段。Trainium4预计将提供6倍的FP4性能，4倍的内存带宽，2倍的内存容量，并支持通过NVLink Fusion和UALink进行扩展。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第8张

02.新模型：阿里、Kimi、MiniMax模型上架，第二代自研模型Nova 2四款齐发

亚马逊云科技Amazon Bedrock推理平台已拥有超过10万客户，使用其处理超1万亿个token的企业客户已超过50家。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第9张

亚马逊云科技一贯秉持“选择至关重要（Choice Matters）”的理念，这也体现在模型选择上。加曼称，AI的未来不会由单一模型主导，过去一年，Amazon Bedrock上提供的模型数量已翻倍，DeepSeek、Qwen等中国模型也已纳入支持范围。

Amazon Bedrock今日新增18款全托管开源模型，包括Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2等中国模型。此外，谷歌Gemma、英伟达Nemotron以及全新的Mistral Large 3和Ministral 3（3B、8B和14B版本）等模型也已登陆Amazon Bedrock平台。

亚马逊云科技还发布了第二代自研模型家族Nova 2系列，推出4款新模型：Lite、Pro、Sonic和Omni。

Nova 2 Lite是一款快速且经济高效的推理模型，适用于多种工作负载，具备良好的指令遵循、工具调用、信息提取、代码生成等能力。Nova 2 Lite在上述四大领域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模型，仅在编程能力上略逊于GPT-5 mini。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第10张

Nova 2 Pro是Nova系列中最智能的推理模型，支持文字、图像、视频、语音四种模态输入和文本模态输出，适用于高度复杂的工作负载，尤其是智能体场景。在两项智能体基准测试中，其表现已超过GPT-5.1（high）、Gemini 3 Pro Preview（high）等前沿模型。

Nova 2 Sonic是亚马逊云科技的下一代语音转语音模型，支持文本和语音两个模态的输入输出，能为AI应用提供实时、类人的对话式AI体验。在语音理解和推理任务上，其性能已超过GPT Realtime、Gemini 2.5 Flash等。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第11张

Nova 2 Omni是Nova系列的新成员，也是业界首个支持文本、图像、视频和音频输入，并支持文本和图像生成输出的推理模型。不过，亚马逊云科技尚未公布其基准测试成绩。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第12张

03.新服务：开放Nova模型训练检查点，助力企业训练专属前沿模型

加曼谈到，AI需要具备理解公司数据的能力，才能为公司及客户创造巨大价值。

由于数据的独特性，企业通常不希望自己的专有数据被嵌入第三方模型供他人使用。过去，业内让企业数据与模型结合常用技术是RAG或向量数据库，但这无法让模型真正理解数据。要教会模型理解行业知识，仍需定制模型。

然而，从零开始定制模型成本极高，企业往往缺乏足够数据和算力来构建强大的通用智能。

若在开源模型基础上通过微调、强化学习等方式打造行业模型，则可能面临其他领域性能下降的风险。

亚马逊云科技的解决方案是Amazon Nova Forge。Nova Forge引入了“开放式训练模型（Open Training Model）”概念。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第13张

通过Nova Forge，企业可以独家访问各种Nova模型的训练检查点，并在模型训练的任意阶段，将自己的专有数据与亚马逊创建的训练数据集混合。这使得企业能够产出深度理解自身信息的模型，同时不会遗忘模型已训练的核心知识。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第14张

Nova Forge还提供了使用远程奖励函数和强化学习微调的能力，以进一步改进模型，让企业可以将真实环境集成到训练循环中。由于基础模型已理解业务，这些后训练技术实际上会变得更加有效。

亚马逊云科技已与多家企业试点了Nova Forge服务。索尼便通过Nova Forge对Nova 2 Lite模型进行了微调，使其适配自身业务和运营。模型在引用一致性和文档依据等任务上表现优于基准模型，索尼的目标是借此将合规审查和评估流程效率提升100倍。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第15张

04.新工具：为智能体开发设定边界和评估标准

今日，亚马逊云科技宣布Amazon Bedrock AgentCore新增两项新功能，助力开发者快速构建智能体。自AgentCore SDK预览版发布以来，其5个月内下载量已超过200万次。

此前，亚马逊推出了为智能体设计的核心工具集AgentCore，包含部署、代码解释器、托管环境等多种能力。在此基础上，亚马逊推出Policy in AgentCore预览版和AgentCore Evaluation预览版。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第16张

Policy in AgentCore允许开发者在AgentCore Gateway工具调用运行前进行拦截，使用带有细粒度权限的策略为智能体行为定义明确界限，如指定可使用哪些工具、如何使用工具，开发者也可通过自然语言创建标准，例如“当报销金额大于1000美元时，阻止退款操作”等。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第17张

AgentCore Evaluations是一项全托管服务，帮助开发者持续监控和分析基于真实行为的智能体表现。开发者可使用内置评估器衡量常见质量维度，如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性，还可创建基于模型的定制评分系统，根据自选提示和模型进行业务定制评分。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第18张

所有AgentCore的评估结果均会在亚马逊统一监控平台CloudWatch呈现。开发者还可设置评估分数的警报和通知，主动监控智能体质量，并在指标超出可接受阈值时作出响应。

亚马逊此前构建了Amazon Quick和Amazon Connect两个智能体方案。

首先是Amazon Quick，可帮助员工在几分钟内将想法转化为行动，指导深度研究并获取详尽分析，其能从获取信息中整理出详细研究报告；员工还可创建小型智能体，协助处理日常重复性工作。几周前，亚马逊在公司内部发布了Amazon Quick，目前其已拥有数十万用户。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第19张

其次是Amazon Connect，加曼谈到亚马逊内部税务团队的案例，该团队创建了一个智能体，帮助汇聚所有税务数据来源、深入研究税法政策变化。该智能体的另一应用场景是客户服务，可将AI引入企业的联络中心。

05.新智能体：加速开发、优化编程、保障安全、增强可靠性

加曼认为，对于试图快速现代化其应用程序的开发团队而言，当前最大痛点之一是处理技术债。在美国，技术债务每年给企业造成总计2.4万亿美元的损失，如今70%的IT预算用于维护遗留系统。

此前，亚马逊云科技已推出AWS Transform，通过AI实现转换流程的降本增效。在此基础上，AWS今日推出AWS Transform Custom，这一智能体帮助用户创建自定义代码转换智能体，以实现任何代码、API、框架、运行时或编程语言的翻译和现代化。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第20张

例如，全球知名ERP软件公司QAD使用AWS Transform，将原本至少需要两周才能完成的转换项目压缩至3天。

今年早些时候，亚马逊云科技发布了面向专业开发者的AI IDE“Kiro”。加曼称，已有数十万开发者在使用Kiro，有开发者感叹，使用Kiro后，过去5个月内交付的代码量超过过去10年。上周，亚马逊已将Kiro定为公司官方AI开发环境。

为进一步加强开发流程的自动化程度，亚马逊云科技发布了三款全新的前沿智能体，使Kiro在自主性、大规模可扩展和长期运行等领域的表现进一步提升。

Kiro Autonomous Agent是一个与开发工作流并行运行的自主开发智能体。它如同团队的一名额外成员，能独立处理复杂任务，让工程师专注于核心创意。开发者只需指派一个复杂的目标导向任务，它能自行规划、分解并执行所有必要步骤，直至交付可用代码。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第21张

这一智能体还会越用越智能，能长期深度理解代码库、团队规范和过往决策，从每次互动中学习，形成“集体记忆”，并将所学知识应用到后续任务中。

AWS Security Agent是一个持续、主动、内置的AI安全专家。它能在设计阶段主动审查文档，确保安全性；在编程过程中扫描代码漏洞，并直接集成到GitHub PR中，为开发者提供即时、可操作的修复建议。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第22张

这一智能体还能将渗透测试自动化，将传统昂贵且周期长的渗透测试转变为可按需启动、快速完成的自动化持续验证过程。

AWS DevOps Agent将运维工作自动化，能自动诊断并修复问题。当警报触发时，DevOps Agent会立即自动响应，诊断问题的根本原因，提供修改意见和方案，并交由工程师审查批准。

06.新实例、新存储、新数据库、新加速、管理与治理

加曼最后用10分钟公布了25项新发布。

AWS re:Invent 2025：AI基础设施、模型与智能体工具全面革新 Trainium4 Amazon Nova 2 Agent开发第23张

7款新实例：搭载第五代AMD EPYC处理器的X8i Instances，内存增加超50%；搭载第五代AMD EPYC处理器的X8aedz Instances，计算性能是前一代X2iezn实例的两倍；搭载第五代AMD EPYC处理器的C8a Instances，性能提升30%，性价比提升19%；搭载英特尔至强6的C8ine Instances，每个vCPU的数据包性能可比上一代C6in实例提升2.5倍；搭载第五代AMD EPYC处理器的M8azn Instances，计算性能是上一代M5zn实例的2倍。

还有两款采用最新苹果硬件的新实例：EC2 M3 Ultra Mac Instances、EC2 M4 Max Mac Instances。

面向开发者，亚马逊云科技推出Lambda durable functions（持久函数），开发者可利用内置的自动恢复功能构建长期运行的工作负载。

存储方面，包括将S3最大对象大小从5TB提高至50TB，增加10倍；亚马逊S3的数据管理功能S3 Batch Operations更新，在200亿个对象的规模下，完成作业的速度提升10倍；为S3 Tables提供智能分层，节省80%存储成本；S3 Tables支持AWS区域和账户间自动复制；扩展Amazon S3接入点，支持Amazon FSx for NetApp ONTAP；用于存储和查询向量的对象存储S3 Vectors全面上市；利用GPU提升向量索引构建效率，速度提升10倍，成本仅需1/4。

计算与加速优化新功能，Amazon EMR Serverless提供Amazon EMR on EKS，允许用户在不预先配置或管理存储的情况下运行大数据工作负载。

Amazon RDS数据库的更新包括：RDS for Oracle和RDS for SQL Server扩展存储容量、RDS for SQL Server的CPU优化选项、对SQL Server开发者版本的支持，以及数据库节省计划。

管理与治理相关的新发布包括：为ECS和EC2新增GuardDuty扩展威胁检测功能、提供近乎实时分析及风险优先级排序功能的Security Hub安全中心、CloudWatch统一数据管理和分析功能。