当前位置:首页 > 科技资讯 > 正文

国产GPU双雄登陆A股:摩尔线程与沐曦的资本盛宴与技术路线之争

在摩尔线程登陆A股不到两周后,另一家国产芯片公司沐曦也成功上市。

与摩尔线程相似,沐曦同样缔造了惊人的财富传奇:上市首日股价飙升568.83%,收盘于700元/股,总市值高达2800亿元。此次IPO募集资金41.97亿元,发行价定为104.66元/股,网上中签率仅为0.03348913%。

中一签的盈利接近30万元,一举刷新了A股市场今年的打新收益记录。

相比之下,被称为“国产英伟达”的摩尔线程,截至发稿时股价报715.06元/股,较昨日收盘微涨0.51%,当前总市值约3361亿元,位列A股第三高价股,仅次于寒武纪和贵州茅台。

股价与市值的火爆表现,让沐曦与摩尔线程这两家国产GPU头部企业站到了聚光灯下。然而,资本市场的热度背后,折射出两家公司截然不同的基因底色、技术路线博弈,以及对国产算力替代赛道的差异化布局。

两家国产GPU芯片在资本市场接连缔造财富神话,无疑会让“英伟达国产平替”们的上市之路更加紧迫。问题在于,谁会成为第三个幸运儿?这场财富盛宴又能持续多久?

01

如果说摩尔线程是国产英伟达,那么沐曦就是国产AMD。

沐曦成立于2020年9月,创始人陈维良曾在AMD工作17年,担任过AMD全球GPGPU设计总负责人,负责全球通用计算GPU产品线的整体设计与管理,主导并完成了15款高性能GPU产品的流片与量产。联合创始人彭莉和杨建均为AMD企业院士。

彭莉是AMD全球首位华人女性企业院士,在AMD任职多年,历任图形架构师、系统架构师、首席芯片架构师等职务。杨建在AMD工作了14年,同样拥有深厚的GPU技术积累。

沐曦的产品线清晰,分为三大系列。曦思N系列专注于AI推理,首款智算推理芯片曦思N100于2022年1月交付流片,2023年4月正式量产。曦云C系列主打训推一体和通用计算,是公司目前的主力产品,曦云C500于2024年2月正式量产,采用7nm工艺,聚焦AI训练、推理及科学计算。曦彩G系列负责图形渲染,目前仍在研发阶段,尚未量产。

从产品路线看,沐曦走的是典型的“先推理、再训练、最后补齐图形”的路径。

2022年,沐曦率先以推理芯片打开市场;2024年训推一体芯片量产后迅速成为营收支柱,图形渲染则留待后续打磨。

国产GPU双雄登陆A股:摩尔线程与沐曦的资本盛宴与技术路线之争 国产GPU 摩尔线程 沐曦 CUDA生态 第1张

业绩数据彰显了这家公司的爆发力。2022年营收仅42.64万元,2023年跃升至5302.12万元,2024年达到7.43亿元,三年复合增长率高达4074.52%。2025年前三季度营收已达12.36亿元,同比增长453.52%,全年营收预计在15亿至19.8亿元之间。

但高增长的背后是持续的亏损。2022年至2024年,归母净利润分别为-7.77亿元、-8.71亿元、-14.09亿元,三年累计亏损超过30亿元。2025年前三季度亏损3.46亿元,尽管亏损幅度收窄,但距盈利仍有距离。公司预测最早将于2026年实现盈亏平衡。

这种财务状况在国产GPU行业实属常态。GPU芯片属于资本和技术双密集型行业,前期研发投入巨大,需持续烧钱打磨产品和生态,只有当出货量提升、规模效应显现后,才有可能扭亏为盈。摩尔线程同样如此,预计最早2027年才能盈利。

沐曦的客户主要集中在国家算力平台、智算中心、行业头部企业等To B场景。产品已部署于10余个智算集群,覆盖北京、上海、杭州、长沙、香港等地,服务对象涵盖教科研、金融、交通、能源等行业。2024年营收中,曦云C500系列贡献了98%的收入,单一产品依赖度极高。

这既是优势也是风险。优势在于资源集中、目标明确,能将有限资金和人力投入最核心的产品;风险在于一旦C500被竞品超越或遭遇技术瓶颈,公司营收将立刻受到冲击。

从累计销量看,截至2025年第一季度,沐曦GPU累计销量超过2.5万片,2025年预计总出货量在3万至5万片之间。这一数字与英伟达一年550万张的出货量相比差距悬殊,但在国产GPU领域已属头部水平。

02

反观摩尔线程,其创始人张建中曾在英伟达工作14年,担任过英伟达全球副总裁、大中华区总经理。他亲历了GPU从图形芯片演变为AI基础设施的全过程,对英伟达的CUDA生态体系有着深刻理解。

摩尔线程的核心高管中,同样有多位来自英伟达。

这种基因差异直接决定了两家公司的技术路线选择。

摩尔线程的MUSA架构走的是转译兼容路线。核心工具MUSIFY能够将CUDA C++源代码自动转换为MUSA C++源代码,再通过MUSA编译器生成基于MUSA指令集的二进制代码。

这种策略的杀手锏在于零门槛迁移:开发者用CUDA编写的代码,可在MUSA平台上无需修改直接运行,甚至常见CUDA算子也能即插即用。

MUSA已开源Torch-MUSA、OpenCV-MUSA、vLLM-MUSA等工具链,全面适配PyTorch、TensorFlow、百度飞桨等主流AI框架。截至2024年11月,Torch-MUSA专属支持的算子总数已超过1050个。

这种策略的优势显而易见:开发者学习成本低,现有CUDA生态可快速迁移,对于急需国产替代方案的客户而言,这是最现实的选择。

国产GPU双雄登陆A股:摩尔线程与沐曦的资本盛宴与技术路线之争 国产GPU 摩尔线程 沐曦 CUDA生态 第2张

但软肋也同样明显。本质上,这是在CUDA生态上加了一层转译层,英伟达的专利武器库随时可能引爆,且转译过程必然带来性能损耗,无论优化多好都难以完全避免。更关键的是,这条路走到极致也只是“更好的兼容版”,很难说是真正的技术自主可控。

沐曦的MACA软件栈走的是自主指令集路线。GPU IP包含指令集、微架构在内全部自研,拥有独立知识产权,从底层与CUDA彻底切割。

MACA提供类C编程语言,兼容主流C/C++异构计算语法,但需要开发者重新学习和适配。

这种策略的优势在于长期安全:不受英伟达EULA条款约束,技术演进完全自主可控,可规避专利风险。但代价是生态重建成本巨大。

MACA直到2025年2月才开源工具链,比MUSA晚了近两年。开发者社区的活跃度远不如摩尔线程,迁移工具的易用性也有明显差距。除非客户被完全禁止使用任何英伟达产品(包括CUDA),否则主动迁移的意愿普遍较低。

相较之下,MUSA软件栈2022年首发,已形成完整开发生态。

产品线战略上,摩尔线程走的是To C加To B双线布局。

To C端,摩尔线程的春晓芯片拥有220亿晶体管规模,集成4096个MUSA流处理核心加128个专用张量计算核心,主频1.9GHz,FP32算力15.2TFLOPS。

核心优势在于全功能架构:单芯片同时支持现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎、物理仿真四大引擎,覆盖DirectX、OpenGL、Vulkan、OpenCL等主流接口。MTT S3000是业内首款支持PCIe 5.0标准的GPU产品,256bit显存位宽配32GB GDDR6显存。

这种设计使其能横跨AI智算、云游戏、云渲染、视频云等多场景。To C端的MTT S80消费级显卡搭载完整的春晓芯片,可流畅运行《暗黑破坏神3》《英雄联盟》等主流游戏。

这是国内唯一支持Windows DirectX 12的游戏显卡,也是国内唯一能批量出货桌面级显卡的厂商。

To B端,摩尔线程的产品线更为丰富。MTT S3000面向云渲染、云游戏等企业场景;更高端的MTT S4000是训推一体智算卡;MTT S5000则支持FP8精度,专为大模型训练和推理优化。同时,摩尔线程还推出了面向数据中心的万卡互联方案KUAE。

沐曦则走纯To B路线,产品线高度聚焦。

沐曦的曦云C500采用7nm工艺,通用GPU架构,专注AI训练、推理及科学计算,对标英伟达A100。

尽管其自研指令集和可重构GPU架构宣称通过独创硬件加速单元优化算力能耗比,突破了传统GPU能效瓶颈。

但曦彩G系列图形渲染GPU仍在研发阶段,无法提供成熟的图形能力。下一代旗舰曦云C700号称接近英伟达H100,但在H100高达4000TFLOPS的算力面前,15TFLOPS的C500更像是在追赶上一代产品。

曦思N100专注推理,曦云C500兼顾训练与推理,曦彩G系列图形渲染尚在PPT阶段。

本质上,这是两种不同的豪赌:摩尔线程赌的是CUDA生态护城河会逐渐松动,通过转译工具抢夺英伟达的开发者;沐曦赌的是自主可控的战略价值会倒逼客户接受生态重建成本。

前者像当年Android兼容Java应用的策略,后者则是自研内核。

03

然而历史已给出残酷的答案。

AMD在全球GPU市场苦战20年,市占率始终徘徊在10%左右,面对英伟达的CUDA生态壁垒几乎无解。这场国产AMD与国产英伟达的路线分歧,如何才能避免重蹈覆辙?

同时,沐曦和摩尔线程也面临相同问题:其产品性能远低于英伟达最新的旗舰产品。

根据摩根大通的数据,2025年英伟达出货550万张GPU。

国产GPU双雄登陆A股:摩尔线程与沐曦的资本盛宴与技术路线之争 国产GPU 摩尔线程 沐曦 CUDA生态 第3张

相较之下,摩尔线程AI计算芯片出货量约1.5万至2万片,消费级显卡及SoC约15万片(多为面向信创PC和轻薄本市场的低算力产品)。沐曦截至2025年第一季度累计销量2.5万片,2025年预计总出货量3万至5万片。

原因并非价格,而是性能存在至少2至3代的代差。

单张H100的性能相当于国产旗舰GPU的3到5倍,且英伟达的迭代速度比国产厂商更快。等沐曦、摩尔线程的下一代产品面世时,英伟达的B系列已开始收割市场。

更要命的是,大部分所谓的“国产化订单”本质上是被动替代,而非客户主动选择——买不到英伟达才退而求其次。12月8日,特朗普宣布放宽英伟达H200出口政策后,字节内部迅速成立“H200自采项目组”,腾讯则参与紧急会议并提交H200需求预测报告。

从现状来看,目前国产GPU的真实应用场景大多集中在推理场景(算力要求低,国产勉强够用)、教育科研(不追求极致性能)以及一些强制国产化的采购项目。

但在真金白银的商业AI训练市场,主动选择国产方案的客户数量并不多。

从已有订单看,沐曦和摩尔线程大概率会继续获得融资和政策支持,营收也将随着强制国产化订单增长。

但要真正成为客户的首选而非备胎,需解决三大核心问题:性能、软件生态成熟度、供应链稳定性达到英伟达水平。

国产GPU的故事注定是一场漫长的马拉松,IPO首日涨5倍的狂欢并不能代表未来。

就在摩尔线程、沐曦双雄逐鹿科创板之际,另一个玩家——百度旗下的昆仑芯也传出赴港IPO的消息。2025年12月,路透社援引知情人士称,昆仑芯计划最早于2026年一季度向港交所递交上市申请,目标2027年初完成IPO,最新投后估值约210亿元。

更引人注目的数据是:昆仑芯2024年营收约20亿元,超过已上市的摩尔线程(4.38亿元)和沐曦(7.43亿元),甚至超过了寒武纪(11.74亿元)。摩根大通预测,其2026年营收或将暴涨至83亿元,是2025年预期的6倍。

更关键的是,昆仑芯是大厂自用模式的典型代表。百度持股59.45%,文心大模型的万卡训练集群便采用昆仑芯,这种“左手研发、右手采购”的闭环是摩尔线程、沐曦等市场化公司无法复制的天然优势。

昆仑芯选择港股而非科创板,或许也透露出其直至2026年才有望实现盈亏平衡,A股对盈利的硬性要求显然不太友好。其外部客户占比约40%,包括vivo、吉利汽车、招商银行、南方电网等,看似多元化,但核心仍靠百度内部订单撑起规模。

大厂自用能保证订单稳定,但若找不到其他出路,天花板便就此锁死。

不过,对于一直对百度市值不满的李彦宏而言,昆仑芯上市是一次难得的享受市场“高估”的机会。盛宴不常,盛筵难再,英伟达国产平替们唯有努力成为财富神话,或许才能有足够的储备撑到黎明。