当前位置:首页 > 科技资讯 > 正文

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第1张

示意图

回顾上个月,科技巨头中最大的赢家无疑是谷歌,其凭借Gemini 3的卓越表现,在短短半个月内股价飙升,不仅在AI竞技场中与OpenAI展开较量,更在硬件领域对英伟达构成直接挑战。

Gemini 3的强劲性能推动谷歌市值攀升,同时展示了自研TPU的实力,引发行业广泛关注。

短期波动,无碍长期趋势

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第2张

谷歌股价走势图

英伟达作为AI芯片龙头为何受冲击?原因在于谷歌透露,Gemini 3 Pro完全基于自研TPU训练,未依赖英伟达硬件,这标志著谷歌在AI算力自主化上迈出关键一步。

随后,媒体和业界热议纷纷,认为谷歌TPU可能打破英伟达CUDA生态的垄断壁垒。

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第3张

相关媒体报道

那么,TPU究竟是什么?它是一种专为AI计算设计的芯片,与GPU同源,但针对矩阵运算等AI任务进行深度优化。

TPU虽近期才走入大众视野,但其研发始于2015年,是谷歌长期布局的AI基础设施项目。

初代TPU设计展示

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第4张

第一代TPU实物图

当时谷歌正推动搜索推荐算法向深度学习转型,但发现GPU不仅算力不足,且能耗极高,成本难以承受。GPU为追求通用性,架构复杂,包含多层次存储和计算单元,导致数据搬运成本远超计算本身,能效低下。

GPU架构工作原理

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第5张

GPU数据流示意图

因此,大部分电力消耗在数据迁移而非实际计算上,最终转化为热损耗。这在图形渲染中可行,因渲染需求随机,数据需频繁存取。

但AI矩阵运算具有固定模式,数据计算路径可预测。GPU却仍需将中间数据存回显存再读取,造成显著效率浪费。

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第6张

GPU能效瓶颈示意图

为此,TPU作为AI专用芯片诞生。它剥离GPU中不必要的图形处理模块,专注优化AI计算核心。

其关键技术是“脉动阵列”,专门加速矩阵乘法。数据在计算单元间流动,避免频繁读写存储,大幅提升效率。

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第7张

TPU脉动阵列工作图

因此,TPU每周期计算操作数达数十万次,是GPU的近十倍。初代TPU v1能效比超同期NVIDIA Tesla K80约30倍,性价比突出。

起初谷歌谨慎推进,TPU仅用于推理,功能单一。从第二代开始,谷歌提升内存容量和传输速度,使TPU支持训练任务。

TPUv3规模扩张推动训练加速

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第8张

TPU训练性能对比图

然而,多年来TPU成本更低、性能相当,为何企业仍青睐英伟达芯片?实非企业不愿,而是谷歌策略限制:TPU仅通过谷歌云租赁,绑定服务,令企业担忧供应链风险。

即便这样,苹果等公司仍被其性价比吸引,租赁部分TPU。此次TPU热潮,既因Gemini 3验证其能力,也因第七代TPU Ironwood开放销售。

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第9张

第七代TPU Ironwood外观图

据The Information报道,Meta正与谷歌洽谈价值数十亿美元合同,计划从2027年起部署TPU,并可能明年开始租赁。消息一出,谷歌股价上涨2.1%,英伟达下跌1.8%。

谷歌内部人士称,此举可能抢占英伟达数十亿美元市场,削减其年收入约10%。

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第10张

媒体市场分析图

华尔街看好TPU前景,认为其市场潜力巨大,甚至带动供应商博通业绩预期上调。

但TPU取代GPU之说为时尚早。

TPU属于ASIC,即专用集成电路,擅长AI矩阵计算,但通用性有限。这既是优势,也是局限。

TPU架构工作模式

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第11张

TPU计算流示意图

当前大模型依赖矩阵计算,TPU因此受益。但若AI技术路线变革,TPU可能迅速过时。例如,四年前的TPU v4已少见应用。

相比之下,GPU更具通用性。以五年前的RTX 3090为例,凭24GB显存和CUDA生态,至今仍可运行Llama 8B等模型。即使AI需求下降,GPU也可服务于游戏和设计领域。

此外,CUDA生态是英伟达核心护城河。

如同用户习惯iOS系统,迁移到安卓需付出成本,AI开发者基于CUDA的代码、库和调试经验,转向TPU需重构代码并适应新环境。

尽管TPU支持PyTorch,但底层优化和自定义算子需调整,且专用语言JAX增加学习门槛。对于中小企业,直接采用英伟达芯片更便捷高效。

谷歌TPU强势崛起:Gemini 3引爆AI芯片竞争新格局 TPU  GPU AI芯片 谷歌云 第12张

社交媒体讨论截图

值得注意的是,谷歌自身仍采购英伟达GPU,以满足谷歌云客户需求。

因此,TPU的销售确实在大模型训练领域对英伟达构成竞争,但远未到取代GPU的程度。

未来算力市场,TPU可能服务于大厂专用需求,而GPU保持通用市场主导。巨头竞争有望降低算力成本,促进行业发展。

撰文:莫莫莫甜甜

编辑:江江 & 面线

美编:萱萱

图片、资料来源:

Google Cloud 官网

EITC、FUTUBULL、雅虎金融、The informaiton、Reddit、X、CNBC

https://arxiv.org/abs/1704.04760