当前位置:首页 > 科技资讯 > 正文

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界

人工智能领域的算力鸿沟正以惊人速度扩大,学术界尤其感受到GPU资源的极度匮乏。在NeurIPS 2025会议期间,两位来自YC的知名人士组织了一场小型晚宴,邀请了14位美国顶尖高校实验室的负责人。席间,多位教授纷纷倾诉,他们所在机构的计算资源状况令人堪忧,堪称“惨不忍睹”。

学术界的GPU短缺问题,远比外界想象的更为严峻,甚至可以用“百倍差距”来形容。

NeurIPS 2025期间,两位YC背景的行业领袖组织了一场闭门饭局,与会者包括14位来自美国顶尖高校的实验室负责人。令人意外的是,席间充斥着对算力资源的抱怨:学术界的计算资源简直“贫瘠得可怕”。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第1张

出于好奇,Francois Chaubard深入挖掘了相关数据,结果令人瞠目结舌——

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第2张

以下是美国顶尖大学实验室的GPU人均拥有量情况——

· 普林斯顿:人均0.8张GPU

· 斯坦福:人均0.14张GPU(其超算集群Marlowe仅有248张H100可用)

· 哈佛、UW、CMU:人均GPU数量在0.2至0.4张之间徘徊

· 加州理工、MIT、UC伯克利:人均GPU甚至不足0.1张

如今,要开展稍有规模的AI研究,人均至少需要1张GPU。而现实是,真正要实现突破,人均8张才算勉强够用。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第3张

没有对比,就没有伤害。

与此同时,全球顶尖科技公司的前沿实验室动辄拥有十万张GPU起步的算力集群。

以微软的Fairwater Atlanta数据中心为例,其当前算力每月可完成23次GPT-4规模的训练任务。换句话说,当年训练初代GPT-4耗时约90至100天,而在同等时间内,如今这个数据中心能将该过程重复近70次。这种巨型数据中心大幅提升了前期实验和最终模型训练的规模与频次。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第4张

预计到2026年底,马斯克的Colossus 2超级计算机将使这些数字至少翻倍。

而到了2027年底,微软的Fairwater Wisconsin数据中心单月有望完成超过225次GPT-4规模的训练任务。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第5张

马斯克旗下的xAI正在利用百万张GPU串联的超级巨兽「Colossus 2」训练Grok 5模型。

学术GPU资源极度短缺

2024年,李飞飞在一次炉边谈话中坦言,「斯坦福NLP实验室仅有64张GPU」。这一现实折射出学术界在AI计算资源方面的断崖式落后。

与此同时,《自然》杂志的一项调查提出了「AI算力差距」的概念,揭示了同样令人沮丧的事实:在训练AI模型时,学术界科学家可用的计算资源与工业界完全不在一个量级。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第6张

上述数据恰恰印证了高校GPU资源根本无法支撑大规模AI实验的窘境。这种现象在美国和中国高校中普遍存在。

在Reddit一篇热门帖子中,一位博士生自曝缺乏H100显卡,算力成为项目推进的主要瓶颈。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第7张

此外,Uvation的调研显示,GPU在高校课程和教学中的地位日益重要,正在重塑学生学习计算机科学和工程学的方式。下表列举了斯坦福、MIT、牛津大学等需要使用GPU的相关课程。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第8张

学术界GPU短缺绝非小事,其影响如多米诺骨牌般扩散。杜克大学陈怡然教授指出,由于工业界与学术界在计算和数据资源上的差距拉大,AI科研人员不再将高校教职视为理想目标。这意味着顶尖人才将加速流向工业界,而根源正是GPU匮乏。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第9张

另一方面,由于GPU有限,学术界难以验证重大创新想法,正逐渐丧失定义前沿的能力。2025年斯坦福AI指数报告中的一张图清晰呈现了这一趋势:谷歌、Meta、微软、OpenAI等科技巨头产出的有影响力AI模型数量远超学术界。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第10张

AI专家Sebastian Raschka表示,资源少只是问题之一。另一个问题是,这些资源通常只能通过SLURM(或类似调度系统)访问,缺乏交互模式。除非研究者已经明确要运行的实验及耗时,否则这一流程极其折磨人。这种条件下做研究难上加难。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第11张

此外,学校里的GPU并非随时可用。网友Lucas Roberts分享,他上月与德州一位教授交流,对方表示学校的GPU每次最多只能运行24小时,时间一到就得保存检查点并重新排队。后来他好不容易为实验室争取到经费购买了几张卡,才实现了“不断连”的任务运行。据他所知,这种24小时强制中断的规定在其他高校也很普遍。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第12张

然而,LeCun当场反驳了这一观点,透露NYU拥有全美学术机构中规模最大的GPU集群——具体数字为500张H200,比普林斯顿还要庞大。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第13张

部分高校自建AI工厂,奋力追赶

不过,也有一些高校条件相对优越。微软研究院前高级研究员、威廉与玛丽学院助理教授Jindong Wang表示,其实验室每位学生配备6张GPU,还有云集群可用。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第14张

Vector研究所研究总监、多伦多大学统计与计算机系教授Dan Roy透露,他们会给每位学生配备1张GPU。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第15张

更有豪气的学校,比如得克萨斯大学奥斯汀分校,直接为自家的AI基础设施购买了超过4000张Blackwell GPU。加上原有设备,UT Austin总共将拥有超过5000张英伟达GPU,并且据称由自家发电站提供电力支持。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第16张

这些英伟达GB200系统和Vera CPU服务器将加入全美最大的学术超算「Horizon」,为UT Austin提供学术界最强悍的AI算力。这种级别的算力意味着UT Austin完全有能力从零构建开源大语言模型。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第17张

无独有偶,加州州立理工大学也启动了由英伟达DGX加持的「AI工厂」——配备了4套NVIDIA DGX B200系统,整合了高性能存储、网络设施以及NVIDIA的全套AI软件栈。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第18张

有了这套系统,那些以前在标准硬件上需要数月才能完成的研究任务,例如分析数十万个视频文件,现在只需几天即可完成。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第19张

反观国内,GPU在高校的分布情况也不均衡。知乎上一个话题下,硕博生纷纷讨论做实验用的显卡。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第20张

北京某高校计算机硕士称,已申请到研究院公用服务器。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第21张

还有更窘迫的,某985学生自曝全组只有一张3080,还得自费租GPU。

学术界深陷GPU荒:人均不到0.1张卡,AI科研主导权正流向工业界 GPU短缺 学术界 工业界 AI算力差距 第22张

参考资料:

https://x.com/FrancoisChauba1/status/1997095264923078856?s=20

https://news.utexas.edu/2025/11/17/ut-eclipses-5000-gpus-to-increase-dominance-in-open-source-ai-strengthen-nations-computing-power/

https://x.com/EpochAIResearch/status/1997040687561449710

https://epoch.ai/data-insights/gpt-4s-trainable