长期以来,谷歌的张量处理单元(TPU)一直专注于支撑自家AI模型的运行。但随着TPUv7的推出,这一策略发生了根本性转变。芯片分析机构SemiAnalysis披露,谷歌正积极向第三方企业销售其TPU芯片,直接与行业巨头英伟达展开正面交锋。
AI初创公司Anthropic成为了谷歌TPU的首批重要外部客户之一。分析指出,这笔交易涉及大约100万颗TPU芯片,采购方式包括直接购买硬件和通过谷歌云平台(GCP)租赁。支持这套庞大硬件体系运转的基础设施,其总功耗预计将超过1吉瓦(即10亿瓦)。
市场竞争态势已然生变。SemiAnalysis的报告提到,OpenAI因为转向采用TPU或其他替代方案,在与英伟达的采购谈判中成功获得了大约30%的价格折扣。
TPU技术栈虽然在性能上一直能与英伟达的AI硬件抗衡,但过去其主要服务于谷歌的内部计算需求。即便谷歌在2018年将TPU开放给GCP客户使用,它也并未完全走向市场化。
然而,这一局面正在持续改变。近些年,谷歌调动了其全栈资源,不仅通过GCP向外部客户提供TPU算力,甚至开始作为商业供应商销售完整的TPU系统。依托其强大的内部芯片设计实力,谷歌正逐步转型为一个提供差异化服务的云服务商。
这一动向恰好与Anthropic(谷歌的关键合作伙伴)希望降低对英伟达依赖的战略相契合。因此,与Anthropic达成的这项合作,被视为谷歌在外部商业化道路上迈出的关键一步。
谷歌在早期就对Anthropic进行了投资,并同意不享有投票权,同时设定了15%的股权上限,旨在推动TPU在谷歌生态系统外的应用。这一策略的成功,部分得益于Anthropic团队中拥有前DeepMind成员,他们精通使用TPU进行大规模模型训练,这使得Anthropic能够利用TPU等硬件成功训练出其Sonnet和Opus 4.5模型。
除了通过GCP租用算力,Anthropic还将在其自建的数据中心内部署TPU硬件,这使得谷歌能够直接以硬件供应商的身份,与英伟达在销售层面竞争。
关于100万颗TPU的详细分配,将分为两个步骤进行:
第一步是直接销售:博通公司将直接向Anthropic出售价值约100亿美元的成品机架,其中包含40万颗TPUv7(代号Ironwood)芯片。这笔交易使得Anthropic成为了博通财报中所披露的第四个重要客户。
第二步是云租用:Anthropic还将通过谷歌云平台(GCP)租用另外60万颗TPUv7芯片。这部分业务预计将产生约420亿美元的履约价值,占据了GCP第三季度新增订单积压(490亿美元)的绝大部分。
需要指出的是,Anthropic并不自行运维这些硬件。现场的安装、测试以及远程运维等工作,外包给了谷歌云顶级服务商Fluidstack;而数据中心的基础设施则由合作伙伴TeraWulf和Cipher Mining提供。
SemiAnalysis预测,在未来几个季度,谷歌云有望与Meta、OpenAI等其他AI领域巨头达成类似的交易,从而进一步拉动其云服务和硬件销售业务的增长。
实际的应用案例表明,TPU已不再是备选方案。近期发布的两款顶尖AI模型——谷歌的Gemini 3 Pro和Anthropic的Claude 4.5 Opus,都主要依托于谷歌TPU和亚马逊的Trainium芯片进行训练。其中,Gemini 3更是完全基于TPU训练完成。
从技术参数看,TPUv7“Ironwood”在理论算力(FLOPs)和内存带宽上已经接近英伟达Blackwell架构的产品。但其真正的核心竞争力在于价格优势。
图:谷歌TPU芯片规格
对谷歌自身而言,每颗TPU的总拥有成本(TCO)比英伟达GB200系统低大约44%。即便是对于需要支付额外溢价的外部客户如Anthropic,每个有效计算单元的成本仍可能比英伟达系统低30%至50%。
图:单位小时总成本对比
这一优势在专业的软件优化团队手中还会被放大。谷歌的系统支持将多达9216颗芯片互联为一个统一的计算域,而英伟达的系统通常只能将64到72颗芯片组成紧密集群。这种架构上的差异使得TPU在分布式AI训练任务中具备了更出色的扩展性。
图:TPU互联方式
软件兼容性一直是制约TPU广泛普及的长期障碍,英伟达的CUDA平台仍然是业界事实上的标准。为此,谷歌正在加大投入以消除这一障碍,据称正在开发对PyTorch框架的原生支持,并集成vLLM等热门推理库。
图:谷歌TPUv7与英伟达GB200/GB300对比
谷歌的目标是让TPU成为一个可行的替代方案,且不要求开发者重构整个工具链。不过,TPU软件栈核心的XLA编译器目前仍是专有技术。SemiAnalysis认为这是一个战略失误,开源该组件有望加速开发者社区的接纳。
为了推进芯片的快速部署,谷歌采用了创新的融资与合作模式:与Fluidstack等新兴云服务商以及TeraWulf等加密矿企合作。在这些合作中,谷歌常常扮演财务保障的角色:若运营方出现问题,谷歌承诺支付租金。这一策略有助于将现有的加密矿场基础设施快速转型为AI算力设施。
面对谷歌的强势进攻,英伟达正在筹备技术反击。预计在2026年到2027年推出的“Vera Rubin”芯片将采用HBM4内存等激进设计,以提供更高的带宽和性能。
谷歌的应对策略是进行TPUv8的双线开发。据SemiAnalysis透露,谷歌计划推出两个版本:与博通合作的“Sunfish”,以及与联发科合作的“Zebrafish”。尽管实现了供应商多元化,但设计上仍显得相对保守。分析师指出项目已有延迟,且并未积极采用台积电2nm工艺或HBM4内存等前沿技术。
这对于谷歌至关重要。如果英伟达成功实现Rubin芯片的性能飞跃,TPU目前所拥有的价格优势可能会荡然无存。SemiAnalysis预警称,英伟达的Rubin系统(特别是“Kyber Rack”配置)甚至可能在谷歌内部的某些工作负载中,比其自家的TPUv8更具经济效益。
“谷歌已经亮出了底牌,现在压力来到了英伟达这边,它必须完美执行其技术路线图才能维持市场领导地位。”SemiAnalysis总结道。
如果英伟达能够精准落实其技术蓝图,则将继续领跑市场。但若其在性能兑现或量产进度上出现任何失误,其市场主导地位将面临严峻挑战。
本文由主机测评网于2026-01-31发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260122085.html