大模型的通用性和泛化性日益强大,虽然新模型如备受争议的GPT-5.2在专业任务和智能水平上表现出色,但与人们期待的AGI(通用人工智能)相比,依旧遥不可及。
尽管如此,大家对AGI的热情与信心并未减退,或许下一款重磅大模型就能初步实现AGI的构想。
然而,近期卡耐基梅隆大学教授、AI2研究科学家Tim Dettmers发表了一篇长文博客《Why AGI Will Not Happen》,认为由于物理原因,我们无法实现AGI,也无法实现任何有意义的超级智能。
这篇文章无疑给人们对AGI的热情泼了一盆冷水,引发了广泛讨论。
这篇文章探讨了硬件改进、通用人工智能、超级智能、规模法则、人工智能泡沫等相关话题。
博客链接:https://timdettmers.com/2025/12/10/why-agi-will-not-happen/
许多思考AGI、超级智能、缩放定律及硬件进步的人,常将这些概念视为抽象理念,像哲学思想实验一样讨论。这一切建立在对AI与规模化根本性误解之上:计算是物理的。
要实现高效计算,需在两件事情间取得平衡:其一,将全局信息移动到局部邻域;其二,将多份局部信息汇聚起来,将旧信息转化为新信息。虽然局部计算的复杂性几乎恒定——更小的晶体管能大大加速这一过程,但移动到局部计算单元的距离呈平方级增长——改进效果很快变得次线性。
需记住两个要点:第一,缓存越大,速度越慢。第二,随着晶体管尺寸不断缩小,计算变得越来越便宜,而内存在相对意义上却变得越来越昂贵。
如今计算单元在芯片中的占比已微不足道,几乎所有面积都用来做内存。若一块芯片上实现10 exaflops的算力,却无足够内存服务,这些FLOPS就成了“无效算力”。
正因如此,AI架构如Transformer本质上是物理的。我们的架构并非随意构思、抛出的抽象想法,而是对信息处理单元的物理层面优化。
这里存在两种现实:物理现实与观念空间中的现实。
在物理现实中,若需在时间和空间上聚集资源产生某种结果,出于物流和组织原因,想要在线性尺度上产出效果,往往需要线性规模的资源投入。但由于物理性限制,这些资源在空间或时间上会产生竞争,使得资源汇聚速度必然越来越慢。
美国和中国在AI上采取了两种截然不同的路径。美国遵循“赢家通吃”思路——谁先构建出超级智能,谁就赢了。其核心信念是:把模型做到最大、最强,人自然会来。
中国的理念则不同。他们认为模型能力本身并不重要。真正重要的是如何使用AI,这个模型是否实用、是否能以合理成本带来生产力提升。
这篇博客的核心观点是:当前AI系统仍具巨大提升空间,通往更强AI的道路也远不止一条。只要仔细观察,你会发现通向至少一个数量级(10×)算力提升的具体路径和研究议程。
本文由主机测评网于2026-05-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260546736.html