英伟达以200亿美元巨资收购Groq,旨在补齐AI发展的下半程关键短板。随着AI从训练向推理转型,尤其是慢思考模型的兴起,传统GPU的显存延迟瓶颈愈发显著。黄仁勋此举不仅吞并了Groq领先的SRAM架构与软件团队,还省去了两年研发时间,同时成功封锁了谷歌与微软的技术路径,确保了英伟达在AI算力领域的绝对领导地位。
在硅谷的圣诞节前夕,黄仁勋为全球半导体行业送上了一份震撼的礼物。
这不是新品发布,而是一张高达200亿美元的支票。
英伟达宣布与AI芯片独角兽Groq达成非排他性技术授权协议,并直接带走了包括创始人Jonathan Ross在内的核心工程团队。
Jonathan Ross
仅仅几个月前,Groq的估值还仅为69亿美元。
英伟达不仅支付了接近三倍的溢价,而且实际上并未完全收购Groq公司(Groq的云服务业务将被拆分出售),它只买走了Groq的技术蓝图和造蓝图的人。
在这看似疯狂的溢价背后,隐藏着黄仁勋对AI下半场战局深刻的忧虑与冷酷的算计。
这是一场针对推理时代的抢滩登陆战。
要理解这笔交易,我们必须先了解AI算力正在发生的分裂。
瑞士银行在一份犀利的研报中,将未来的AI推理市场比作一条双车道高速公路。
第一条车道,是英伟达目前统治的领域。
这里运行的是像GB300这样的通用GPU重型卡车。
它们配备了海量的HBM(高带宽内存),如同卡车后面拖着的巨大集装箱。
这种架构极其灵活,能装载大型模型,特别适用于大模型的训练阶段,或者处理对吞吐量要求极高但对延迟不太敏感的任务。
但问题出在第二条车道。
随着AI从训练转向推理(即用户实际使用AI的过程),尤其是需要AI进行实时语音对话、高频交易或自动驾驶决策时,GPU的短板就暴露出来了。
GPU在计算时需要频繁地从外部HBM内存中搬运数据,这就像卡车司机每次送货都要跑回仓库取件一样,由于物理距离的存在,这种搬运成为了速度的瓶颈。
Groq所在的正是这条第二条车道——ASIC类架构。
Groq的设计哲学非常激进:它摒弃了外部内存,直接将数据存储在芯片内部的SRAM(静态随机存取存储器)中。如果说GPU是拖着集装箱的卡车,那么Groq的LPU(语言处理单元)就是把行李直接背在身上的短跑运动员。
数据就在计算单元旁边,触手可及。
这种架构带来了极致的低延迟和确定性。
对于正在兴起的推理市场,Groq展示了一种英伟达GPU难以比拟的响应速度。
除了底层的硬件架构外,促使英伟达掏出200亿美元的另一个关键诱因是AI模型本身进化出的新形态——推理模型。
具备慢思考能力的模型在回答复杂问题前会进行漫长的思维链推理。在这个过程中,模型需要进行类似蒙特卡洛树搜索(MCTS)的操作,在无数种可能性的路径中快速试错、跳转。
这正是Groq技术的用武之地。
蒙特卡洛树搜索本质上需要极高频的生成与验证且高度依赖内存的快速读写。SRAM架构在这种任务中的表现理论上要远优于依赖HBM的传统GPU。
既然SRAM架构这么好,英伟达自己造不出来吗?
当然能造出来。英伟达的Rubin路线图中早已规划了相关技术。
但在科技界时间就是一切。Groq最核心的资产是它打磨了数年的软件栈。
Groq的创始人Jonathan Ross曾是谷歌TPU的核心设计者他们团队构建了一套能让编译器完美调度芯片内部数据流的软件系统。
对于AI芯片来说硬件是肉体软件(编译器、内核库、运行时)才是灵魂。如果英伟达从头搭建一套类似Groq的高效SRAM软件生态可能需要18到24个月。在日新月异的AI战场落后18个月等于退赛。
这200亿美元虽然看似昂贵但对于手握600亿美元现金储备的英伟达来说不过是其庞大帝国的一笔保险费。通过这笔交易英伟达向市场释放了一个清晰的信号:英伟达绝不允许任何死角存在。
本文由主机测评网于2026-06-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260647246.html