当前位置:首页 > 科技资讯 > 正文

亚马逊AWS发布Trainium 3芯片及Nova 2模型,加速AI硬件创新

美东时间12月2日周二,亚马逊云计算部门AWS在年度云计算盛会re:Invent上重磅推出新一代人工智能训练芯片Trainium 3,并预告了下一代产品Trainium 4的开发蓝图,此举旨在进一步挑战英伟达和谷歌在AI芯片市场的主导地位。同时,AWS还发布了Nova 2系列模型和多项全新AI服务,力求在激烈的AI竞赛中抢占更多市场份额。此次发布不仅彰显了亚马逊在硬件领域的野心,也为其云服务客户提供了更多高性价比的选择。

AWS宣布,Trainium 3芯片已于近期部署至数个数据中心,并从本周二当天起正式向客户开放使用。AWS的副总裁Dave Brown表示:“进入明年初,我们将开始非常非常快速地扩大规模。”这一速度远超行业常规,亚马逊在前一代加速器部署仅一年后便推出了Trainium 3,与英伟达承诺的每年更新节奏相当,显示出亚马逊在AI硬件领域的追赶决心。

亚马逊AWS发布Trainium 3芯片及Nova 2模型,加速AI硬件创新 AWS Trainium 3芯片 Nova 2模型 AI芯片竞争 第1张

这款芯片的推出速度确实引人注目。亚马逊在部署前一代加速器约一年后便发布了Trainium 3,与英伟达承诺的每年发布新芯片的快节奏相当,表明AWS正在努力缩短产品迭代周期,以跟上市场领先者的步伐。

亚马逊希望吸引那些追求高性价比的企业客户。公司宣称,Trainium芯片能以比英伟达市场领先的图形处理单元(GPU)更低廉和高效的方式,为AI模型背后的密集计算提供动力。Brown表示:“我们对Trainium实现正确的价格性能比的能力感到非常满意。”他强调,性价比是许多企业选择云服务商的关键因素,而Trainium芯片正是为了满足这一需求而生。

亚马逊周二不仅发布了四款新模型,还推出了业内首创的“开放式训练”服务Nova Forge,并发布了专注于浏览器任务自动化的代理服务Nova Act。这些服务与Trainium芯片共同构成了AWS在AI领域的完整产品矩阵,从底层硬件到上层应用,全面覆盖企业AI开发需求。

此次发布的Nova 2家族涵盖推理、多模态处理、对话式AI和代码生成等多个领域,主打价格性能比优势,旨在为企业提供多样化、灵活的AI解决方案,降低开发和部署成本。

新AI芯片的消息公布后,亚马逊股价逼近239美元刷新日高,日内涨幅扩大到将近2.2%,而盘初曾涨3.2%的英伟达股价进一步收窄涨幅,美股早盘尾声时刷新日低,几乎抹平所有涨幅。其竞争对手AMD的股价跌幅扩大、日内跌近1.7%。到收盘,亚马逊涨逾0.2%,英伟达涨近0.9%,AMD跌近2.1%。市场反应表明,投资者对AWS的AI芯片战略持积极态度,但英伟达和AMD的股价波动也反映出市场竞争的激烈程度。

亚马逊AWS发布Trainium 3芯片及Nova 2模型,加速AI硬件创新 AWS Trainium 3芯片 Nova 2模型 AI芯片竞争 第2张

Trainium 3性能大幅跃升:3纳米制程与4倍性能提升

AWS称,其第四代 AI 芯片Trainium 3是首款采用3纳米(nm)制程的AWS AI芯片,专为下一代智能体、推理和视频生成应用程序App提供最佳代币经济效益而打造。3纳米制程意味着更小的晶体管尺寸和更高的能效,这使得Trainium 3在性能提升的同时,功耗控制也更加出色。

据AWS官方数据,搭载Trainium 3芯片的Trn3 UltraServer系统在训练和推理性能上都实现了显著提升。相比第二代产品,新系统速度提升超过4倍,内存容量增加4倍。这种跨越式升级将大幅缩短AI模型的训练时间,帮助企业更快地将产品推向市场。

每颗Trainium 3芯片提供2.52千万亿次浮点运算(PFLOPs)的FP8算力,内存容量较Trainium 2增加1.5倍至144GB HBM3e,内存带宽提升1.7倍至4.9TB/s。高带宽内存对于处理大规模AI模型至关重要,能够减少数据访问延迟,提升计算效率。

单台完整配置的Trn3 UltraServer可容纳144颗芯片,总算力达362 PFLOPs,并提供高达20.7TB的HBM3e内存和706TB/s的聚合内存带宽。这种强大的集群能力使得Trainium 3能够支持超大规模AI模型的训练和推理,满足顶尖研究机构和企业级客户的需求。

能效提升同样引人注目。AWS表示,Trn3 UltraServer的能效比前代产品提高40%,性能功耗比提升4倍。在Amazon Bedrock平台上,Trainium 3成为AWS最快的加速器,性能较Trainium 2提升3倍,每兆瓦输出token数量增加超过5倍,且延迟水平相当。这意味着在相同功耗下,Trainium 3可以处理更多任务,帮助企业降低运营成本。

Brown在采访中表示:“我们对Trainium在价格性能方面的表现非常满意。”该系统还可在EC2 UltraClusters 3.0中扩展至数十万颗芯片,AWS称其目标是年底前为AI初创公司Anthropic提供100万颗芯片。这一目标展示了AWS对Trainium芯片的信心,也预示着Anthropic将获得强大的算力支持,加速其AI模型的迭代。

Trainium 4将支持英伟达互联技术,打破生态壁垒

亚马逊在会上还预告了正在开发中的Trainium 4芯片。这款下一代产品将带来性能的重大跃升,并将支持英伟达的NVLink Fusion高速芯片互联技术。NVLink是英伟达专有的多GPU互联技术,能够实现GPU之间的高速数据传输,这对于大规模并行计算至关重要。

这一技术兼容性意味着,搭载Trainium 4的AWS系统将能够与英伟达GPU互操作并扩展性能,同时仍使用亚马逊自研的低成本服务器机架技术。这可能帮助AWS吸引那些基于英伟达GPU开发的大型AI应用迁移至亚马逊云平台。通过支持NVLink,AWS降低了客户从英伟达平台迁移的障碍,使得混合使用不同芯片成为可能,为客户提供更多灵活性。

值得注意的是,英伟达的CUDA架构已成为所有主流AI应用支持的事实标准。Trainium 4对NVLink的支持或将降低这些应用转向AWS的技术门槛。如果开发者能够继续使用熟悉的CUDA工具链,同时利用Trainium芯片的成本优势,这将极大地推动AWS AI芯片的普及。

亚马逊未公布Trainium 4的具体发布时间表。按照以往发布节奏,外界预计将在明年的re:Invent大会上获得更多信息。届时,我们有望看到更多关于Trainium 4的性能数据和客户案例。

软件生态仍是短板,AWS积极弥补差距

尽管硬件性能强劲,亚马逊芯片仍面临生态系统挑战。与英伟达相比,AWS芯片缺乏帮助客户快速部署的深度软件库。英伟达的CUDA生态系统经过多年发展,拥有丰富的库、工具和社区支持,开发者可以轻松地将现有模型迁移到英伟达GPU上。

建筑设备自动驾驶公司Bedrock Robotics的首席技术官Kevin Peterson表示,虽然该公司在AWS服务器上运行基础设施,但在构建指导挖掘机的模型时仍使用英伟达芯片。“我们需要它性能强大且易于使用,”Peterson说,“那就是英伟达。”这句话道出了许多开发者的心声:除了硬件性能,软件的易用性和生态成熟度同样重要。

目前使用Trainium芯片的主要客户是Anthropic,这些芯片分布在印第安纳州、密西西比州和宾夕法尼亚州的数据中心。AWS今年早些时候表示,已将超过50万颗芯片串联起来帮助Anthropic训练最新模型,并计划在年底前为这家OpenAI的劲敌提供100万颗芯片。Anthropic的深度合作将为Trainium芯片提供宝贵的实际应用经验,帮助AWS优化软件栈。

不过Anthropic同时也在使用谷歌的TPU(张量处理单元),并在今年早些时候与谷歌达成协议,获得价值数百亿美元的计算资源。这表明即使是深度合作伙伴,也会采用多元化策略,避免单一供应商锁定。AWS需要在更多客户中证明Trainium的价值。

除Anthropic外,亚马逊公布的其他主要客户寥寥,令分析师难以评估Trainium的实际效果。AWS表示,日本的LLM Karakuri、Splashmusic和Decart等客户已在使用第三代Trainium芯片和系统,并显著降低了推理成本。这些早期客户的反馈将为后续推广奠定基础。

AWS承诺通过AWS Neuron SDK和原生PyTorch集成,让开发者无需更改任何模型代码即可进行训练和部署,试图以此缩小与英伟达的软件生态差距。Neuron SDK是AWS专为Trainium和Inferentia芯片开发的软件栈,旨在提供与主流框架的无缝集成。如果AWS能够持续投入软件生态建设,未来有望吸引更多开发者加入其平台。

四款Nova 2模型各有侧重,覆盖多场景需求

亚马逊此次推出的四款Nova 2模型针对不同应用场景设计。Nova 2 Lite是一款快速、经济的推理模型,专为日常工作负载设计,可处理文本、图像和视频并生成文本。它适合那些对响应速度要求高、但对成本敏感的场景,如客服聊天机器人、内容摘要等。

在与竞争对手的基准测试对比中,该模型在15项测试中有13项表现优于或持平Claude Haiku 4.5,在17项测试中有11项优于或持平GPT-5 Mini。这表明Nova 2 Lite在多项任务上具有竞争力,能够以更低的成本提供相当或更好的性能。

Nova 2 Pro是亚马逊最智能的推理模型,可处理文本、图像、视频和语音并生成文本,适用于代理编码、长期规划等高度复杂任务。它能够处理多模态输入,并生成复杂的输出,适合需要深度理解和推理的企业应用。

该模型在与Claude Sonnet 4.5的16项基准测试中有10项表现更优或持平,与GPT-5.1的16项测试中有8项更优或持平,与Gemini 2.5 Pro的19项测试中有15项更优或持平。这些数据表明Nova 2 Pro在多个基准上表现优异,尤其是在与Gemini 2.5 Pro的对比中优势明显。

亚马逊AWS发布Trainium 3芯片及Nova 2模型,加速AI硬件创新 AWS Trainium 3芯片 Nova 2模型 AI芯片竞争 第3张

Nova 2 Sonic是亚马逊的语音到语音模型,统一了文本和语音理解及生成功能,支持实时、类人对话式AI。该模型拥有100万个token的上下文窗口,支持扩展的多语言功能,并可与Amazon Connect、Vonage、Twilio等电话服务提供商无缝集成。这对于构建智能语音客服、语音助手等应用非常有用。

Nova 2 Omni是业内首款统一的多模态推理和生成模型,可处理文本、图像、视频和语音输入,同时生成文本和图像。该模型可同时处理多达75万个单词、数小时音频、长视频和数百页文档,一次性分析整个产品目录、客户评价、品牌指南和视频库。这种强大的多模态能力使其能够应用于复杂的业务分析、内容生成等场景。

Nova Forge开创“开放式训练”模式,赋能企业定制AI

Nova Forge是AWS推出的首创服务,让企业能够构建自己的Nova模型定制版本——亚马逊称之为“Novellas”。该服务开创了“开放式训练”模式,为客户提供对预训练、中期训练和后训练Nova模型检查点的独家访问权限,使客户能够在模型训练的每个阶段将专有数据与亚马逊Nova策划的数据集混合。这种前所未有的灵活性使得企业能够更深入地将专有知识融入AI模型中,提升模型在特定领域的表现。

这一服务解决了企业在将专有知识嵌入AI应用时面临的三大难题:定制专有模型时整合深度有限、继续训练开源权重模型时缺乏原始训练数据访问权限,或从零开始构建模型成本高昂。Nova Forge通过提供模型检查点和数据混合能力,让企业能够在已有模型基础上进行高效定制,避免了重复劳动和成本浪费。

除了模型检查点和数据混合能力,Nova Forge还提供三项核心功能:使用客户自己的环境(称为强化学习“gyms”)训练AI的能力,创建更小、更快模型的选项,以及实施安全控制的负责任AI工具包。这些功能为企业提供了全面的模型定制工具,确保定制过程安全可控。

Reddit正在使用Nova Forge改进内容审核系统。Reddit首席技术官Chris Slowe表示:“我们正在用单一、更准确的解决方案替代多个不同的模型,使审核更加高效。用一种统一的方法替代多个专门的机器学习工作流程,标志着我们在Reddit上实施和扩展AI方式的转变。”Reddit的案例展示了Nova Forge如何帮助企业简化AI应用架构,提升效率。

Booking.com、Cosine AI、Nimbus Therapeutics、野村综合研究所、OpenBabylon和索尼等公司也在使用Nova Forge构建自己的模型。客户使用Nova Forge创建的模型可以部署在Amazon Bedrock上,享有与其他Bedrock模型相同的企业级安全性、可扩展性和数据隐私保护。这种无缝集成进一步降低了企业部署定制模型的难度。

Nova Act实现浏览器任务自动化突破,提升企业运营效率

Nova Act是AWS推出的新服务,用于构建和部署能在网络浏览器中执行操作的高可靠性AI代理。该服务由定制的Nova 2 Lite模型驱动,为构建和管理自动化浏览器任务的代理提供最快、最简便的路径。Nova Act在早期客户工作流程中实现了90%的可靠性,并在相关基准测试中表现优于竞争模型。这种高可靠性对于企业自动化关键业务流程至关重要。

亚马逊AWS发布Trainium 3芯片及Nova 2模型,加速AI硬件创新 AWS Trainium 3芯片 Nova 2模型 AI芯片竞争 第4张

Nova Act通过强化学习训练定制的Nova 2 Lite模型,在数百个模拟网络环境中运行数千项任务,从而实现突破性可靠性。这种训练方式使Nova Act在基于用户界面的工作流程中表现出色,例如更新客户关系管理系统中的数据、测试网站功能或提交健康保险索赔。它能够像人类一样操作浏览器,执行重复性、规则明确的任务,从而解放员工专注于更高价值的工作。

开发人员可以在几分钟内使用无代码平台通过自然语言提示开始原型设计,然后在VS Code等熟悉的集成开发环境中完善代理,最后部署到AWS。客户在本地构建和测试的内容可以在生产环境中扩展,并通过Nova Act AWS控制台获得全面的管理工具和监控。这种低门槛的开发方式使得企业能够快速构建自动化代理,并轻松管理多个代理的部署和运行。

亚马逊介绍,多家企业已经注意到Nova Act的成效。其中,初创公司Sola Systems集成Nova Act后,每月为客户自动化数十万个工作流程,涵盖对账支付、协调货运和更新医疗记录等关键业务任务。这大大提升了Sola Systems的服务效率和准确性,使其能够为客户提供更快速、可靠的服务。

1Password使用Nova Act减少用户访问登录信息的手动步骤,只需一个简单提示即可在数百个不同网站上自动工作。这一功能简化了用户管理密码的流程,提升了用户体验和安全性。

Hertz通过使用Nova Act自动化其租赁平台的端到端测试,将软件交付速度提高了5倍,消除了质量保证瓶颈,将原本需要数周的工作缩短至数小时。Nova Act在软件测试领域的应用展示了其强大的自动化能力,帮助企业加快产品迭代速度,提升竞争力。

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。