当前位置:首页 > 科技资讯 > 正文

AI进展与未来:Dwarkesh的核心观点

Dwarkesh 这个名字,或许对许多人而言尚感陌生。然而,关注 AI 领域的朋友们定能在近期的播客采访中,捕捉到 Ilya Sutskever 与 Andrej Karpathy 的身影。他们所参与的正是 Dwarkesh 主持的播客。

这两人的播客出镜率极低,能够采访到他们,无疑凸显了 Dwarkesh 在美国 AI 圈内的显著地位。

本文基于 Dwarkesh 最新一期播客,汇总了他对 AI 进展的一些独到见解。

在此之前,他已在个人网站上更新了相关内容,因此我在文章结尾还精选了几个来自该网站的评论。

鉴于 AI 进展,乃至 AGI 的时间线均属主观话题,因此除了作者的见解,评论区的反馈同样具有参考价值。

AI进展与未来:Dwarkesh的核心观点 AI进展 AGI 强化学习 持续学习 第1张

Dwarkesh 的核心论点:

1.强化学习为核心的中训练,正成为 LLM 的突破方向。前沿科技公司正通过所谓的“中训练”(mid-training),将大量具体技能预先嵌入模型。

Dwarkesh 认为,这正是 AGI 遥不可及的证明。若模型具备强大的泛化能力,便无需单独构建众多强化学习环境,教它操作浏览器或 Excel。

2.预置技能的想法颇为奇怪。人类劳动力之所以有价值,恰恰是因为训练成本不高。

人类可根据需要灵活掌握新技能。每天需进行大量需要判断力、情境感知及工作中习得的知识。若全依赖预置技能,恐连最简单的工作都无法完全自动化。

3.AI 经济扩散滞后,实则能力不足的借口。企业招聘复杂且涉及能力与品格评估。

而 AI 员工无此问题,经过验证的 AI 员工可无损无限复制。换言之,企业有强大动机雇佣 AI 劳动力。当前未发生此现象,只能说明模型能力相差甚远。

4.回应 AI 空头的批评。过去常有人称 AI 现今不行这不行那。但技术发展解决了这些问题。空头提出新标准,论证 AI 能力无限。

作者认为这种标准调整合理,因我们对 AGI 的理解在深化,智能与劳动比我们曾理解的要复杂得多。

5.预训练阶段的 scaling law 非常清晰,算力提升即损失下降。

但当前经验正从中训练转移。这种技术乐观无依据。有研究称,要获得类似 GPT 级别的提升,强化学习算力需提升一百万倍。

6.与人类分布对比,会先高估后低估 AI。

知识工作中大部分价值来自顶尖少数人。若以“中位数人类”对比 AI 模型,会系统性高估其价值。但模型达顶级水平后,其影响力可能是爆炸性的。

7.持续学习将是 AGI 后模型提升的主要驱动力。

他预计明年前沿团队将发布持续学习雏形功能,但达人类水平或需 5 到 10 年。解决不会一蹴而就,故无模型因突破而失控领先。

我们在Scaling什么?

我一直困惑:为何有人认为 AGI 时间线很短,却对强化学习扩展持乐观态度。

若已接近类人学习者,这种基于“可验证结果”的训练路径根本行不通。

目前正试图通过“中训练”把技能预塞模型里。围绕这点形成产业链:公司构建强化学习环境,教模型操作网页或 Excel。

这些模型若能自我驱动学习,则“预烘焙”技能毫无意义;若不能,则 AGI 并非近在咫尺。

机器人领域的张力

机器人是算法问题而非硬件或数据问题。人类很少训练即能操控硬件完成有用工作。若拥有类人学习者,机器人问题将大幅解决。

正因没有这样的学习者,才需进入千家万户学习如何端盘子、叠衣服。

“五年内起飞”阵营的反驳

“我们笨拙的强化学习是为了造出超 AI 研究员。”一个连儿童基本学习能力都没有的自动化研究员要解决人类未解 AGI 算法问题?我觉得这不可信。

“经济扩散滞后”实为能力不足借口

“AI 技术扩散需长时间”是自我安慰。这些模型缺乏创造广泛经济价值的能力。

“调整目标标准是合理的”

“AI 多头常批评空头调整标准”。但调整标准是合理的。如 2020 年看 Gemini 3 会信其能自动化一半知识工作。

“预训练规模化的经验不一定适用于强化学习”

“预训练阶段随算力提升损失下降”。但 RLVR 无良好趋势。Toby Ord 研究称需提升一百万倍算力。“与人类分布的对比”

“人类创造价值差异巨大”。若以“中位数人类”对比 AI 模型会高估其价值。但模型达顶级水平后影响力可能是爆炸性的。“广泛部署带来的智能爆炸”

“人们讨论纯软件奇点”。但我认为 AGI 后能力提升主要来自持续学习。Beren Millidge 提出智能体持续学习带回学习成果进行批量蒸馏的设想。“持续学习的解决”

“实验室明年可能发布持续学习功能”。但要达人类水平或需 5 到 10 年。首个突破模型不会立刻领先。“从部署中学习”

精选评论

Will Michaels: 人类快速学习原因可能是误解空间有限且可预测。而 AI 错误不可预测且直观。设计可预测失败的学习环境是持续学习的一大步。
Argos: 文章不错但过于自信。引用的报告对论断支持弱且有其他解读。
Daniel Kokotajlo: 持续学习会逐渐解决。在 2027 年初前是增量改进;之后因研发自动化加速效应变得更可靠、实现范式迭代并更像人类。