当前位置:首页 > 科技资讯 > 正文

英伟达200亿美元鲸吞Groq:AI推理“速度怪兽”纳入囊中,黄仁勋的“钞能力”再显神威

英伟达200亿美元鲸吞Groq:AI推理“速度怪兽”纳入囊中,黄仁勋的“钞能力”再显神威 英伟达  Groq AI推理芯片 收购 第1张

12月24日,《华尔街日报》爆料称,英伟达与Groq达成了一项非独家授权协议,计划将Groq的AI推理技术整合到其未来的产品线中。根据协议,Groq创始人兼CEO Jonathan Ross、总裁Sunny Madra以及部分核心团队成员将加入英伟达。

此前,CNBC引用投资公司Disruptive的消息透露,这笔交易的金额可能高达200亿美元,且全部以现金形式支付。

如果该金额属实,这将是英伟达成立三十余年来规模最大的收购案,远超过之前以70亿美元收购Mellanox的交易。

那么,Groq究竟有何特别之处?它掌握了哪些核心技术,让英伟达甘愿冒着反垄断审查的风险也要斥巨资收购?这笔交易仅仅是英伟达为了获取AI推理技术,还是背后隐藏着更深层的战略意图?

01

Groq为何让英伟达顶着反垄断审查也要收购?

Groq并不制造GPU,它打造的是被称为LPU的“速度怪兽”,目标是从根本上颠覆冯·诺依曼架构。

要理解Groq这家公司,必须先了解其创始人Jonathan Ross。

在硅谷,Ross常被称作“芯片界的叛逆者”。在创办Groq之前,他是谷歌TPU项目的早期推动者之一。正是他主导开发的TPU,帮助谷歌在这一轮AI算力竞赛中赢得了先机。

然而,就在外界将TPU奉为行业标杆之际,Ross却早已洞察到其中的问题。他认为,无论是GPU还是TPU,本质上都只是在传统的冯·诺依曼架构上修修补补,勉强应对日益庞大的AI模型需求。特别是在处理日益复杂的推理任务时,硬件常常处于被动等待软件调度的低效状态。这条艰难前行的道路,终将走到尽头。

Ross想要开辟的,是一条全新的路径,而这正是Groq创立的初衷。

在Ross看来,AI时代的计算不应当是随机、波动且依赖复杂调度的,而应当是“确定”的。因此,在他领导下的Groq,提出了一种全新的处理器类型——LPU。

LPU的核心设计理念与英伟达的GPU截然相反。

GPU的本质是并行计算,它就像一个拥有数千名普通工人的工厂,虽然能同时处理多项任务,但工人之间的沟通、任务分配以及缓存调度极其复杂。

这种复杂性在处理图形渲染时是优势,但在应对大模型推理时,却转化为致命的延迟。当你向大模型提问,数据在GPU内部流转时,由于调度逻辑的复杂性,每一层计算完成的时间都难以确定,从而导致了所谓的“推理卡顿”。

而Groq最激进的做法,是彻底移除了硬件层面的调度器。

在LPU的世界中,你可以理解为“软件定义硬件”。这意味着,在代码编译阶段,编译器已经精确规划了每一比特数据在芯片内每一纳秒的位置。LPU宛如一条精确到微秒的自动化生产线:第一纳秒数据进入加法器,第二纳秒进入寄存器,第三纳秒输出结果。

这种“确定性架构”使LPU彻底摆脱了延迟波动,也让整个AI业界为之震撼。

在去年年底的测试中,当英伟达的最强显卡因显存带宽和调度瓶颈而在处理大规模上下文时陷入“沉思”时,Groq的LPU却以每秒500到800个Token的惊人速度运行。

这不仅是数字上的领先,更是体验上的飞跃,它真正让AI从一个“好用的工具”转变为“实时响应的智力伙伴”。

更具颠覆性的是,Groq还挑战了英伟达GPU的核心组件——HBM。

目前,英伟达芯片价格高昂且产能受限,很大程度上是因为其高度依赖三星和海力士供应的HBM。而Groq另辟蹊径,采用SRAM来替代HBM。

SRAM的带宽比HBM高出几个数量级,延迟更低,唯一的短板是容量较小。但Groq通过集群设计,将成百上千块芯片互联,构建出一个超低延迟的“显存池”。

这种设计思路不仅在性能上实现了超越,更在供应链层面形成了对英伟达的侧翼包抄。Groq的LPU无需昂贵的显存封装,对复杂的CoWoS封装工艺依赖也较低,这意味着它拥有更强的量产潜力。

在AI行业从“不计成本训练”转向“大规模商业推理”的2025年,Groq推出的这套方案,无异于在英伟达的铁幕上凿开了一道裂缝,透进了光。

正是由于Groq已经打造出这种能从底层重构AI推理的产品,它才成为黄仁勋眼中必须立即“锁定”的目标。

02

收购Groq,或许是英伟达最佳“防守”策略

在硅谷的商业法则中,收购通常分为两种:一种是为了扩大市场占有率的“补全型”收购,另一种则是为了消除潜在生存威胁的“扼杀型”收购。英伟达收购Groq,显然两者兼具。

尽管英伟达目前仍凭借CUDA生态和Hopper/Blackwell架构主导着全球AI算力市场,但这台疯狂吸金的机器并非无懈可击。黄仁勋深知,AI的下半场属于推理。

当大模型训练尘埃落定,成千上万的企业开始部署应用时,市场对算力的需求将从“大力出奇迹”的吞吐量,转向对“毫秒级响应”的极致追求。而这正是英伟达当前的短板。

此次收购Groq,显然包含了“遏制”竞争对手推理能力快速发展的战略考量。

早在Groq成名之前,全球云服务巨头和初创公司就一直在寻找“英伟达之外的替代方案”。经过多年自研,谷歌推出了TPU,亚马逊开发了Trainium,微软打造了Maia。这些巨头试图通过自研芯片摆脱英伟达的“抽成”,并且已经看到了曙光。

然而,对于那些缺乏自研能力的二线云厂商和AI软件公司来说,Groq原本是他们手中最有力的筹码:一旦Groq的LPU集群大规模部署,其极高的能效比和惊人的推理速度,将直接削弱英伟达H100/B200在推理端的性价比优势。

黄仁勋此举,本质上是在“釜底抽薪”。通过将Groq纳入麾下,英伟达不仅获得了一项足以颠覆市场的技术,更重要的是,它让那些试图绕过英伟达、借助Groq构建差异化竞争力的对手们瞬间失去了目标。

其次,英伟达正在经历从“通用芯片”向“专用推理架构”的产品演进。

GPU虽然功能全面,但在推理效率上始终背负着冯·诺依曼架构的沉重包袱。Groq的“确定性架构”和“软件定义硬件”理念,正是英伟达目前最急需的拼图。

通过整合Groq的核心团队,英伟达可以将LPU的低延迟特性深度融入其下一代超级芯片中。这意味着,未来的英伟达产品可能不再仅仅是GPU,而是一个融合了并行计算与确定性流处理的“算力巨兽”。

这将极大加速英伟达纯推理产品的开发进程,也将确保英伟达未来的竞争力。

与其被动等待一个由Groq引领的、可能颠覆自己的新架构时代,不如主动拥抱并将其内化。英伟达可以凭借其卓越的工程能力、软件生态和规模化优势,将Groq的前沿理念快速产品化并推向市场。

这相当于在自己的巨轮上,加装了一台为推理时代量身定制的、动力澎湃的新引擎。

03

结语

从斥巨资入股英特尔、OpenAI、xAI,到如今顶着监管压力强行推进Groq的收购,黄仁勋正在用实际行动诠释什么叫“用金钱买出一个未来”。

收购Groq,本质上是英伟达利用先发优势积累的巨额现金流,为自己购买了一张通往“后GPU时代”的船票。

它不仅通过“扼杀式”收购清除了一个潜在的颠覆者,更通过技术内化,试图将Groq那种令人惊叹的推理速度融入CUDA生态的血脉之中。

在AI这场没有终点的军备竞赛中,英伟达正在构筑一道前所未有的护城河:这条护城河不仅由先进制程和软件生态垒成,更由那些足以颠覆自身的“叛逆技术”所构成。

黄仁勋的逻辑很简单:如果有人要颠覆英伟达,那个人最好就是英伟达自己。