当前位置:首页 > 科技资讯 > 正文

亚马逊AWS在re:Invent 2025推出Trainium 3 AI芯片与Nova 2模型系列,加速自研芯片替代战略

亚马逊AWS在re:Invent 2025推出Trainium 3 AI芯片与Nova 2模型系列,加速自研芯片替代战略 亚马逊AWS  Trainium AI芯片 自研模型 第1张

(亚马逊AWS首席执行官马特·加曼在re:Invent 2025大会上正式发布Trainium 3芯片)

编者注:re:Invent是亚马逊AWS年度全球云计算战略与技术盛会。re:Invent 2025于12月1日至5日在拉斯维加斯举行。我们亲临现场,追踪美国云计算产业最新动态。

内容概要:

12月3日美国西部时间,全球云计算领导者亚马逊AWS在re:Invent 2025大会上,推出了新一代自研AI芯片及模型系列。亚马逊AWS CEO马特·加曼宣布,自研AI芯片Trainium 3正式上线,采用先进3纳米制程工艺。同时,下一代Trainium 4芯片已进入研发阶段。此外,Amazon Nova 2系列模型发布,包括Lite轻量版、Pro专业版、Sonic语音模型及Omni多模态推理模型。该系列已服务数万企业客户,如海信、印孚瑟斯等。

01

亚马逊AWS自研AI芯片部署规模突破百万枚

马特·加曼透露,亚马逊已部署超100万枚Trainium系列AI芯片,年收入贡献达数十亿美元。支撑该算力需巨大电力资源,过去12个月新增3.8吉瓦算力容量。当前算力电力容量为2022年的两倍,预计2027年再翻番。Trainium 3能效显著提升,每兆瓦电力生成Token数量为上代五倍,训练成本最高降低50%。路线图显示,Trainium 4在FP4精度下性能将比Trainium 3提升6倍以上。Trainium芯片通过云服务供客户使用,用户包括Anthropic、Databricks等企业,其中Anthropic计划在2025年底使用超100万Trainium 2算力集群运行Claude模型。

亚马逊AWS在re:Invent 2025推出Trainium 3 AI芯片与Nova 2模型系列,加速自研芯片替代战略 亚马逊AWS  Trainium AI芯片 自研模型 第2张

亚马逊AWS表示,搭载Trainium 3的Trn3 UltraServer服务器集成144枚芯片,总算力达362PFlops,整机性能超越英伟达GB200 NVL72服务器,但单卡性能仅为GB200的56%。亚马逊通过系统级优化,以集群算力和带宽优势弥补单卡差距。

亚马逊AWS在re:Invent 2025推出Trainium 3 AI芯片与Nova 2模型系列,加速自研芯片替代战略 亚马逊AWS  Trainium AI芯片 自研模型 第3张

(Trainium3 UltraServer服务器机柜展示)

亚马逊AWS内部人士曾向《财经》指出,自2021年启动自研AI芯片战略以来,公司已坚持五年,旨在降低算力成本并减少对英伟达依赖,此战略坚定不移。自研芯片可追溯至2018年Graviton系列CPU,历经七年发展至第四代,在AWS新增CPU算力中占比超50%,客户包括苹果、SAP等巨头。

02

云厂商自研芯片浪潮:挑战英伟达主导地位

云厂商自研AI芯片核心目标在于降低总拥有成本(TCO)。目前英伟达占据全球AI芯片市场超60%份额,2025年毛利率达69%,这意味着云厂商采购成本中大部分转化为英伟达利润。资深算法工程师表示,英伟达赚取超额利润,促使科技公司寻求替代,ASIC定制芯片成为可行路径。自研芯片量产后边际成本下降,可接近代工成本,理想情况下价格仅为英伟达芯片三分之一,驱动亚马逊、谷歌、阿里巴巴、百度等投入自研。

2025年11月28日,SemiAnalysis机构报告分析谷歌TPU v7成本:内部使用每小时1.28美元,仅为英伟达GB200 2.28美元的56%;云服务版1.6美元/小时,也仅为英伟达51%。当前,亚马逊与谷歌已实现自研AI芯片规模化替代,其中谷歌TPU出货量更高。

亚马逊AWS在re:Invent 2025推出Trainium 3 AI芯片与Nova 2模型系列,加速自研芯片替代战略 亚马逊AWS  Trainium AI芯片 自研模型 第4张

摩根士丹利2025年11月研报称,谷歌TPU系列2023-2025年出货量分别为50万、240万、175万枚,预测2026年达300万枚。亚马逊Trainium部署超百万枚,谷歌TPU年部署超200万枚,显示两家云厂商已在英伟达市场打开缺口。2025年英伟达AI芯片出货超600万枚,Hopper系列生命周期交付400万枚GPU,Blackwell系列约一年交付600万枚,未来五季度还需交付2000万枚Rubin系列芯片。高盛2025年9月预测,2025-2027年全球AI芯片需求为1000万、1400万、1700万颗,英伟达份额将从62%降至55%。