当前位置:首页 > 科技资讯 > 正文

华为发布昇腾芯片与超节点,引领AI新纪元

9月18日,上海华为全联接大会(HC大会)上,轮值董事长徐直军谈及了年初由DeepSeek引发的全民热潮。

“从今年春节至4月30日,通过多团队的协同努力,昇腾(Ascend)910B/910C的推理能力终于满足了客户的基本需求。”徐直军表示,DeepSeek的推出迅速得到了众多政府机构与央企的响应,作为算力供应商,华为也紧跟步伐。

自2018年首次发布昇腾310芯片、2019年推出昇腾910芯片以来,华为持续在AI基础算力研发与创新上投入。尽管DeepSeek开创的模式大幅降低了算力需求,但徐直军强调,无论是过去还是未来,算力都是人工智能发展的关键。

1、华为发布多款芯片产品,规划至2028年

徐直军宣布,华为面向未来规划了三个系列的昇腾芯片,包括950、960和970系列

其中,昇腾950系列包含两颗芯片:950PR和950DT,前者将于2026年一季度上市,后者则定于2026年四季度推出。

昇腾960芯片计划于2027年四季度上市,而昇腾970芯片预计将在2028年四季度面世。

华为发布昇腾芯片与超节点,引领AI新纪元 昇腾芯片 超节点 AGI 物理AI 第1张

与上一代相比,昇腾950在多个方面实现技术飞跃:新增支持FP8/MXFP8/HIF8、MXFP4等低精度数据格式,算力分别达到1 PFLOPS和2 PFLOPS,大幅提升训练与推理效率;向量算力大幅提升,支持更精细粒度内存访问;互联带宽提升2.5倍,达到2TB/s;并搭载自研HBM技术HIBL1.0和HIZQ2.0。

在通算领域,华为规划了鲲鹏950鲲鹏960,分别将于2026年第四季度和2028年第一季度上市,持续演进以支持超节点和更多核、更高性能。

此外,华为正式发布了面向超节点的互联协议——灵衢,并开放灵衢2.0技术规范。自2019年开始研究,灵衢1.0已开启商用验证。如今灵衢2.0的开放旨在邀请产业界基于灵衢研发相关产品和部件,共建灵衢开放生态。

2、发布全球最强算力超节点

因国际政治等复杂原因,徐直军也在发布会上坦言,华为单片芯片的算力表现不及英伟达,“但华为凭借三十年在连接技术的积累,能够打造世界上算力最强的超节点计算机,满足全球在AI训练推理上的巨大需求。”

超节点(SuperPod)是当前智算发展的重要趋势。徐直军认为,超节点在物理上由多台机器组成,但逻辑上如同一台机器进行机器学习、思考与推理。

在具体业务进展上,华为发布了Atlas 950 SuperPoD和Atlas 960 SuperPoD。其中基于昇腾950芯片的Atlas 950超节点支持8192卡规模,由128个计算柜和32个互联柜组成,占地面积约1000平方米,FP8算力达8EFlops,FP4算力达16EFlops,互联带宽高达16 PB,相当于当前全球互联网总带宽的10倍以上。

华为发布昇腾芯片与超节点,引领AI新纪元 昇腾芯片 超节点 AGI 物理AI 第2张

昇腾950超节点将于2026年第四季度上市,徐直军强调:Atlas 950超节点将是2026~2028年间全球算力最强的AI超节点

而另外的Atlas 960超节点支持15488卡规模,由176个计算柜和44个互联柜组成,算力、内存和带宽在Atlas 950基础上再度翻番,计划于2027年四季度上市。

徐直军特别提到,超节点的价值不仅限于传统业务领域。在互联网产业广泛应用的推荐系统方面也有重要作用。华为基于泰山950和Atlas 950可构建混合超节点,为下一代深度推荐系统开创全新架构方向。

然而,尽管大规模超节点极大提升了智能计算和通用计算能力,但其中的互联技术仍面临挑战。

例如,如何实现8192卡乃至15488卡规模的可靠互联是行业亟待解决的技术难题。当前产业界许多已发布的超节点方案未能实现大规模部署的核心瓶颈并非芯片本身而是互联技术尚未成熟。具体挑战包括:

一是如何实现长距离且高可靠的互联。大规模超节点机柜多,柜间联接距离长达1000至2000米。当前电互联技术在高速信号传输时距离受限最多仅支持两个机柜互联;而光互联技术虽能满足长距离连接需求却无法达到单一计算机系统所要求的高可靠性。

二是如何实现超大带宽与超低时延。当前跨机柜卡间互联带宽与超节点需求存在5倍以上差距时延最好仅能达到3微秒左右与Atlas 950/960设计目标仍有24%的差距。在时延已逼近物理极限的情况下每0.1微秒的提升都极具挑战。

徐直军阐述了两方面的解决途径。

华为发布昇腾芯片与超节点,引领AI新纪元 昇腾芯片 超节点 AGI 物理AI 第3张

首先为解决长距离且高可靠问题华为在互联协议的物理层、数据链路层、网络层、传输层等每一层都引入了高可靠机制;同时在光路引入了百纳秒级故障检测和保护切换当出现光模块闪断或故障时让应用无感;并且华为重新定义和设计了光器件、光模块和互联芯片。这些创新和设计让光互联的可靠性提升100倍且互联距离超过200米实现了电的可靠和光的距离。

其次为解决大带宽且低时延问题华为突破了多端口聚合与高密封装技术以及平等架构和统一协议实现了TB级的超大带宽和2.1微秒的超低时延。

“正是凭借一系列系统性、原创性的技术创新我们才攻克了超节点互联技术满足了高可靠、全光互联、高带宽、低时延的互联要求让大规模超节点成为可能。”徐直军总结道。