当前位置:首页 > 科技资讯 > 正文

超节点算力引领创新,国产GPU未来可期

沐曦科技展台前,一排散发着幽蓝光芒的超节点算力机柜格外引人注目,这些机柜如同钢铁巨人般矗立,单柜128 GPU的标识凸显其强大算力。纯液冷设计让它们摆脱了传统风冷的繁杂散热装置,引得参观者纷纷驻足。

“你面前的其实是一个千卡集群!”沐曦科技展台工作人员向《IT时报》记者介绍,此次展出的是沐曦最新算力技术——超节点机柜,每个机柜配备128 GPU,10个机柜共达1280 GPU。超节点机柜去除了传统风冷装置,仅设计液冷装置,整个机柜的能耗较先前的单机柜群组更加节能。

在WAIC2025展馆内,算力展品琳琅满目。超聚变展出了全球首个多元智算即插即用超级集群系统,单柜配备128张AI加速卡;燧原科技的DeepSeek一体机系列展台前人头攒动,这款产品于2025年初刚推出,支持国产CPU平台和多种场景调优能力。

众多企业超节点算力的扎堆发布,如同一场国产算力创新的“集体冲锋”。随着年初Deepseek的爆火,大模型时代来临,算力需求暴涨,正倒逼国产算力芯片行业加速创新,超节点成为这场攻坚战的关键武器。但在这股创新浪潮下,行业仍对潜在风险保持高度警惕。

超节点算力引领创新,国产GPU未来可期 超节点算力 国产GPU 创新 生态 第1张

创新:超节点算力打响突围赛

“超节点可以理解为大规模集群,以前一台服务器算一个节点,现在超节点把多个节点‘拧成一股绳’,如我们的高密度机柜超节点,一台机柜集成多台服务器,实现128卡甚至更高密度的算力聚合。”沐曦展台工作人员表示,超节点算力本质是应对大模型时代极致算力需求的集群化解决方案。“以前摊开部署多机柜,现在超节点把算力集中,既省了机柜租金、电费,还不用风冷技术,液冷就能搞定散热,契合大模型时代降本增效的需求。”

简单来说,它将多台服务器、多张算力芯片卡整合为规模更大、算力更强的整体算力单元,突破传统算力部署的边界。这种聚合并非简单的硬件堆叠,而是通过优化节点内互联技术、液冷散热等手段,提升集群整体能效、通信带宽与空间利用效率。

在“芯聚算力开芯局,源引AI共未来”为主题的论坛上,沐曦联合创始人、CTO兼首席硬件架构师彭莉带来了旗舰GPU曦云C600。曦云C600集成大容量存储与多精度混合算力,支持MetaXLink超节点扩展技术,并内置ECC/RAS多重安全防护模块,能满足下一代生成式AI的训练和推理需求。“沐曦又一次完成从‘研发优势’向‘产品优势’的关键跃迁。”彭莉表示。

在WAIC现场,超节点的技术特征与创新价值清晰展现。

燧原科技的云燧ESL超节点系统单节点最高可实现64卡全带宽互联,采用液冷方案,追求“高性价比、高密度、高能效”。展台工作人员向《IT时报》记者介绍:“大模型参数量从几百亿级往万亿级跳,传统算力部署在节点通信、空间功耗上扛不住,超节点通过优化内部互联,让算力集群‘跑起来更快、用起来更省’。”

超节点算力引领创新,国产GPU未来可期 超节点算力 国产GPU 创新 生态 第2张

超聚变发布的全球首个多元智算即插即用超级集群系统单柜配备128张AI加速卡,提供112G/224G的高速互连和单柜240kW的超级供电。该系统一柜顶三柜并采用第五代100%原生液冷技术,节能效果可达20%以上。超聚变打造的软硬件基础设施技术与算力生态可兼容10多家加速卡并提供双生态南北向安全异构算力。

超节点扎堆发布背后是大模型发展倒逼的算力变革。传统算力部署存在节点间通信瓶颈、空间占用大、功耗高等问题无法满足大模型训练与推理需求。如行业共识所示模型参数量越大所需卡数越多超节点将分散的算力“攥成拳头”减少机柜占用提升通信效率是支撑大模型发展的必然选择。

瓶颈:国产算力还卡在哪?

在人工智能产业蓬勃发展的当下算力作为其核心驱动力重要性不言而喻。然而国产算力在前进的道路上却面临着诸多阻碍发展现状不容乐观。

从硬件基础来看制程代差成为国产算力芯片难以忽视的痛点。太极股份数字基础设施业务集团总经理孟凡池向《IT时报》表示国内独角兽GPU企业的主力制程集中在7/12/14纳米与国际领先的3/4纳米制程相比存在明显的代际差距导致的性能差距最高可达10倍。这意味着在处理相同复杂任务时国产算力芯片在速度、效率等关键指标上远不及国际先进水平极大限制了其在高端应用场景的使用。

在算力网络架构方面国产算力也处于初级阶段。多名GPU企业的展台工作人员也向《IT时报》记者坦言如今仍受限于光刻机复杂的工艺流程国产GPU发展之路还有待继续突破。

而数据数量、接口闭环等标准尚在起草之中不同设备间的互联率较低延迟、带宽瓶颈以及网络拥塞等问题频发严重影响了算力资源的高效利用。即便拥有先进的智能算法体系面对海量业务资源和复杂任务也会因算力调度不畅出现效率低下和资源分配不均的情况无法充分发挥国产算力的潜力。

散热问题同样掣肘着国产算力的发展。随着GPU服务器功耗不断激增传统风冷散热方式已难以满足需求而液冷技术虽然被视为解决之道但目前其成熟度仍有待提升成本仍有下降空间。

面对通用GPU的“卡脖子”困境中昊芯英创始人及CEO杨龚轶凡认为“多芯多技术路径”是中国AI芯片产业的必然选择。“当市场体量足够大时定制化芯片设计的性价比将远超通用器件至少提升2~3倍甚至可达5~10倍这将显著降低大模型等应用的生产成本。”

他以大模型演进为例:“去年行业普遍认为7B参数模型足矣今年已全面迭代至70B。未来参数膨胀趋势下唯有支持多芯片高效互联的专用架构才能承载。”

“当前算力市场正处于‘一卡难求’的饥渴状态。”孟凡池向《IT时报》透露互联网大厂正掀起算力军备竞赛:阿里计划两年投入3800亿元腾讯、字节跳动也斥巨资布局但美国芯片禁令导致英伟达高端GPU进口受阻国产芯片供应链尚未完全畅通。“对大厂们来说目前都面临算力供应短缺真实需求仍在持续攀升”。

未来:国产GPU替代率或超80%

在全球AI算力需求以每两年750倍速率极速扩张的当下国产GPU发展态势备受瞩目。

英国皇家工程院院士郭毅可在沐曦论坛上预测到2027年中国云端AI芯片市场规模将突破480亿美元国产GPU替代率预计超80%为国产GPU产业描绘了一幅充满潜力的未来蓝图。

技术创新是国产GPU发展的核心驱动力。尽管目前国产独角兽GPU企业主力制程与国际顶尖水平存在代际差距但企业从未停止追赶的脚步。众多企业在制程工艺、芯片架构等方面持续投入研发部分企业已取得阶段性成果产品性能逐步提升。同时定制化芯片设计崭露头角有望凭借更高的性价比在市场中占据一席之地为国产GPU技术发展开拓新路径。

生态构建层面企业间合作愈发紧密。如阶跃星辰联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”推动“芯片—模型—平台”全链路技术贯通。

超节点算力引领创新,国产GPU未来可期 超节点算力 国产GPU 创新 生态 第3张

此外标准制定工作稳步推进。论坛上中国电子技术标准化研究院建立的人工智能国家标准评测基准体系“求索2.0”为国产芯片设计等提供国家级技术指南将推动构建“安全可控、成本优化、场景适配、持续创新”的国产算力体系。并且开源开放趋势明显部分企业开源芯片技术与模型框架吸引全球开发者参与这些均加速国产GPU生态繁荣。