当前位置:首页 > 科技资讯 > 正文

AI云战争:从GPU到Infra的全方位较量

近期,“AI云能否成为科技发展的北极星指标”这一议题,在业内引发了广泛的讨论。

支持者认为,AI云业务的表现与token使用量是高度相关的。最新数据显示,阿里集团FY26Q1财报中,AI产品带动传统云服务实现了同步增长,腾讯云也在海外加速布局,计划建设中东和印尼的数据中心,以支持出海企业的AI需求。

然而,反对者指出,过度关注token这一单一指标,可能会忽视AI云的核心竞争力和大量隐性算力场景,例如政企市场的私有化业务。只看token难以真实反映行业竞争格局。

我们的观点很明确:单一指标并不等同于核心竞争力。就像判断一个孩子未来能否成功,不能只看身高,还要综合颜值、人品、学历、家庭背景和工作能力等因素。同样地,AI云的发展也需要综合考虑多个方面。

AI云战争:从GPU到Infra的全方位较量 AI云 竞争 基础设施 模型 第1张

随着云厂商逐步进入AI Infra(人工智能基础设施)的全栈较量,他们为AI应用提供全生命周期的底层技术体系,包括训练、推理、部署等各个环节。这标志着行业竞争已从单纯的资源供给,升级为全链路业务赋能的综合比拼。这时候,只看token肯定会一叶障目。

不过,从GPU、Maas到AI infra,AI云的竞争要素与指标并不是一开始就定好了的,而是与AI行业同步进化,逐渐演变到当下的样子。

理解这个演进轨迹,比记住一个简单结论重要得多。我们就来回顾一下云厂商的AI大战,是如何循着一条清晰的路径,逐步聚拢于AI Infra的全面战场。

AI云第一战:GPU的弹药库

模型的尖刀

2023年chatgpt的横空出世,大模型浪潮席卷全球,算力成为博弈的关键。云厂商成为中国AI大模型的算力守门人。这场“广积粮”式的抢卡大战,奠定了后来AI云竞争格局的基本盘。

为啥这么说呢?没有最先进的芯片,大模型的训练都无从谈起。一场“抢芯大战”就此拉开帷幕,焦点就是英伟达高端GPU芯片。

可是,N卡很贵,而云厂商是资源大户,更有实力全力角逐英伟达高端GPU资源。据Omdia统计数据,2023年英伟达售出了50万个A100和H100 GPU。腾讯的采购策略最为激进,以5万张H100的采购量稳居国内首位。

AI云战争:从GPU到Infra的全方位较量 AI云 竞争 基础设施 模型 第2张

腾讯云率先发布新一代HCC高性能计算集群,算力性能较前代提升3倍。同时,国内企业仅能采购特供版芯片,但云厂商还能凭借以往跟英伟达的供应链合作关系,争夺到高端算力资源。

AI云战争:从GPU到Infra的全方位较量 AI云 竞争 基础设施 模型 第3张

这一阶段的竞争胜负取决于资本实力与供应链掌控力。

AI云第二战:模型的尖刀

大型游戏云服务拼的是全球多节点、充沛算力、稳定网络以及低价。这与AI有何关系?大模型热潮已席卷一年,说好的AI云大战似乎迟迟未进入核心阶段。

云厂商很快发现,想靠AI+云计算赚到钱,只堆算力并不够。

MaaS赛道的竞争逻辑是把自研大模型锻造成切入业务场景的一把“尖刀”。

阿里云靠开源通义全系列模型+“百炼”平台构建模型的微调与部署一体化。百度智能云则文心闭源+模型超市升级文心大模型。腾讯云发力政企服务市场。

AI云战争:从GPU到Infra的全方位较量 AI云 竞争 基础设施 模型 第4张

风险也在酝酿:模型能力几乎难以拉开差距,这就导致Maas服务对客户的锁定效应不明显。

AI云第三战:Infra的生态锁定

时间来到2025年

一是模型。DeepSeek横空出世,模型重心从训练规模转向推理效率。

二是应用。Agent智能体应用爆发。头部云厂商与中小玩家的差距持续扩大。

为什么支撑大模型和agent应用离不开AI Infra?这背后其实就是一本经济账。

想开源增加AI云的使用量和收入, AI Infra有极强的生态锁定优势。企业一旦将核心业务Agent部署于某家厂商的Infra之上,迁移成本极高,形成稳固的用户粘性。

想节流,硬件芯片的性能释放效率完全依赖Infra层的适配调度能力。特别是在GPU供给受限的背景下,国产集群更需要深度优化来提升算力利用率,让云厂商的单位Token成本持续下降。

AI云战争:从GPU到Infra的全方位较量 AI云 竞争 基础设施 模型 第5张

从底层国产芯片正为AI Infra奠定基础. 华为昇腾性能已接近英伟达,百度昆仑芯片支持万卡集群部署,阿里含光800专攻云端计算优化.