
英伟达计划在下一代Rubin架构中大幅提升CPU核心数,以应对AI时代的新挑战。
长久以来,GPU与AI算力的关联深入人心,然而,随着AI步入由智能体驱动的新时代,CPU正逐渐成为算力瓶颈。
最新研究显示,在Agent执行链路中,CPU消耗的时间占比最高可达90.6%。高并发场景下,CPU端到端延迟显著上升。这表明,在大量Agentic场景中,系统吞吐受限并非GPU计算能力,而是CPU核心数并发调度问题。
英伟达,作为GPU领域的领头羊,近日宣布追加20亿美元投资CoreWeave,以部署专为“代理式推理”设计的Vera CPU。同时,英伟达计划在Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86 CPU的支持。
东吴证券指出,英伟达此举意味着在大规模Agentic场景中,大内存CPU是承载海量KV Cache的最优选择。
与此同时,由于云服务商的大规模采购,英特尔与AMD的服务器CPU产能已告急。为应对供需失衡,两家公司均计划上调服务器CPU价格10-15%。英特尔甚至将部分产能转向服务器端,导致消费电子端交付受阻。
在英特尔2025年第四季度财报电话会上,CEO陈立武表示,尽管AI时代带来了前所未有的需求,但短期内难以满足市场。
为何CPU在AI算力界崛起?国金证券等机构总结道,Agent对CPU需求提升主要源于应用调度压力、高并发工具调用瓶颈及沙箱隔离开销。
随着AI智能体增多,系统调用频次与覆盖面显著升高,增加了系统请求与数据搬运开销。而Agent时代的AI任务包含大量if/else判断,这类“分支任务”更适合由CPU执行。
此外,在Agent场景下,长上下文推理会快速耗尽GPU HBM容量。为解决此问题,业界采用KV Cache Offload技术将数据迁移至CPU内存。因此,CPU搭配大容量内存成为主流架构选择。
从投资角度看,招商证券表示,海外CPU巨头在国内的合作商将受益于CPU涨价。同时,国内AI产业链自主可控推进中,硬件与软件生态适配同步进行,架构升级将提升各环节性能与产量。
国海证券指出,超大规模数据中心进入“升级周期”,CPU架构面临替换需求。预计2026年服务器CPU出货量增长25%。作为AI算力与数据中心升级的核心受益环节,服务器CPU正迎来价值重估机会。
本文由主机测评网于2026-06-17发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260648047.html