当前位置:首页 > 科技资讯 > 正文

谷歌TPUv7战略转型:携手Anthropic商业化硬闯AI芯片市场,直面英伟达竞争

长期以来,谷歌的张量处理单元(TPU)一直专注于支撑自家AI模型的运行。但随着TPUv7的推出,这一策略发生了根本性转变。芯片分析机构SemiAnalysis披露,谷歌正积极向第三方企业销售其TPU芯片,直接与行业巨头英伟达展开正面交锋。

AI初创公司Anthropic成为了谷歌TPU的首批重要外部客户之一。分析指出,这笔交易涉及大约100万颗TPU芯片,采购方式包括直接购买硬件和通过谷歌云平台(GCP)租赁。支持这套庞大硬件体系运转的基础设施,其总功耗预计将超过1吉瓦(即10亿瓦)。

市场竞争态势已然生变。SemiAnalysis的报告提到,OpenAI因为转向采用TPU或其他替代方案,在与英伟达的采购谈判中成功获得了大约30%的价格折扣。

与Anthropic合作:向外部客户提供商业化硬件

TPU技术栈虽然在性能上一直能与英伟达的AI硬件抗衡,但过去其主要服务于谷歌的内部计算需求。即便谷歌在2018年将TPU开放给GCP客户使用,它也并未完全走向市场化。

然而,这一局面正在持续改变。近些年,谷歌调动了其全栈资源,不仅通过GCP向外部客户提供TPU算力,甚至开始作为商业供应商销售完整的TPU系统。依托其强大的内部芯片设计实力,谷歌正逐步转型为一个提供差异化服务的云服务商。

这一动向恰好与Anthropic(谷歌的关键合作伙伴)希望降低对英伟达依赖的战略相契合。因此,与Anthropic达成的这项合作,被视为谷歌在外部商业化道路上迈出的关键一步。

谷歌在早期就对Anthropic进行了投资,并同意不享有投票权,同时设定了15%的股权上限,旨在推动TPU在谷歌生态系统外的应用。这一策略的成功,部分得益于Anthropic团队中拥有前DeepMind成员,他们精通使用TPU进行大规模模型训练,这使得Anthropic能够利用TPU等硬件成功训练出其Sonnet和Opus 4.5模型。

除了通过GCP租用算力,Anthropic还将在其自建的数据中心内部署TPU硬件,这使得谷歌能够直接以硬件供应商的身份,与英伟达在销售层面竞争。

关于100万颗TPU的详细分配,将分为两个步骤进行:

第一步是直接销售:博通公司将直接向Anthropic出售价值约100亿美元的成品机架,其中包含40万颗TPUv7(代号Ironwood)芯片。这笔交易使得Anthropic成为了博通财报中所披露的第四个重要客户。

第二步是云租用:Anthropic还将通过谷歌云平台(GCP)租用另外60万颗TPUv7芯片。这部分业务预计将产生约420亿美元的履约价值,占据了GCP第三季度新增订单积压(490亿美元)的绝大部分。

需要指出的是,Anthropic并不自行运维这些硬件。现场的安装、测试以及远程运维等工作,外包给了谷歌云顶级服务商Fluidstack;而数据中心的基础设施则由合作伙伴TeraWulf和Cipher Mining提供。

SemiAnalysis预测,在未来几个季度,谷歌云有望与Meta、OpenAI等其他AI领域巨头达成类似的交易,从而进一步拉动其云服务和硬件销售业务的增长。

TPU跻身顶级AI模型首选

实际的应用案例表明,TPU已不再是备选方案。近期发布的两款顶尖AI模型——谷歌的Gemini 3 Pro和Anthropic的Claude 4.5 Opus,都主要依托于谷歌TPU和亚马逊的Trainium芯片进行训练。其中,Gemini 3更是完全基于TPU训练完成。

从技术参数看,TPUv7“Ironwood”在理论算力(FLOPs)和内存带宽上已经接近英伟达Blackwell架构的产品。但其真正的核心竞争力在于价格优势。

谷歌TPUv7战略转型:携手Anthropic商业化硬闯AI芯片市场,直面英伟达竞争 谷歌TPUv7  Anthropic 英伟达 AI芯片竞争 第1张

图:谷歌TPU芯片规格

对谷歌自身而言,每颗TPU的总拥有成本(TCO)比英伟达GB200系统低大约44%。即便是对于需要支付额外溢价的外部客户如Anthropic,每个有效计算单元的成本仍可能比英伟达系统低30%至50%。

谷歌TPUv7战略转型:携手Anthropic商业化硬闯AI芯片市场,直面英伟达竞争 谷歌TPUv7  Anthropic 英伟达 AI芯片竞争 第2张

图:单位小时总成本对比

这一优势在专业的软件优化团队手中还会被放大。谷歌的系统支持将多达9216颗芯片互联为一个统一的计算域,而英伟达的系统通常只能将64到72颗芯片组成紧密集群。这种架构上的差异使得TPU在分布式AI训练任务中具备了更出色的扩展性。

谷歌TPUv7战略转型:携手Anthropic商业化硬闯AI芯片市场,直面英伟达竞争 谷歌TPUv7  Anthropic 英伟达 AI芯片竞争 第3张

图:TPU互联方式

软件生态破局:挑战CUDA壁垒

软件兼容性一直是制约TPU广泛普及的长期障碍,英伟达的CUDA平台仍然是业界事实上的标准。为此,谷歌正在加大投入以消除这一障碍,据称正在开发对PyTorch框架的原生支持,并集成vLLM等热门推理库。

谷歌TPUv7战略转型:携手Anthropic商业化硬闯AI芯片市场,直面英伟达竞争 谷歌TPUv7  Anthropic 英伟达 AI芯片竞争 第4张

图:谷歌TPUv7与英伟达GB200/GB300对比

谷歌的目标是让TPU成为一个可行的替代方案,且不要求开发者重构整个工具链。不过,TPU软件栈核心的XLA编译器目前仍是专有技术。SemiAnalysis认为这是一个战略失误,开源该组件有望加速开发者社区的接纳。

为了推进芯片的快速部署,谷歌采用了创新的融资与合作模式:与Fluidstack等新兴云服务商以及TeraWulf等加密矿企合作。在这些合作中,谷歌常常扮演财务保障的角色:若运营方出现问题,谷歌承诺支付租金。这一策略有助于将现有的加密矿场基础设施快速转型为AI算力设施。

英伟达的反击:下一代芯片或重塑优势

面对谷歌的强势进攻,英伟达正在筹备技术反击。预计在2026年到2027年推出的“Vera Rubin”芯片将采用HBM4内存等激进设计,以提供更高的带宽和性能。

谷歌的应对策略是进行TPUv8的双线开发。据SemiAnalysis透露,谷歌计划推出两个版本:与博通合作的“Sunfish”,以及与联发科合作的“Zebrafish”。尽管实现了供应商多元化,但设计上仍显得相对保守。分析师指出项目已有延迟,且并未积极采用台积电2nm工艺或HBM4内存等前沿技术。

这对于谷歌至关重要。如果英伟达成功实现Rubin芯片的性能飞跃,TPU目前所拥有的价格优势可能会荡然无存。SemiAnalysis预警称,英伟达的Rubin系统(特别是“Kyber Rack”配置)甚至可能在谷歌内部的某些工作负载中,比其自家的TPUv8更具经济效益。

“谷歌已经亮出了底牌,现在压力来到了英伟达这边,它必须完美执行其技术路线图才能维持市场领导地位。”SemiAnalysis总结道。

如果英伟达能够精准落实其技术蓝图,则将继续领跑市场。但若其在性能兑现或量产进度上出现任何失误,其市场主导地位将面临严峻挑战。