当前位置:首页 > 科技资讯 > 正文

AI未来:Karpathy的深度剖析与洞见

AI未来:Karpathy的深度剖析与洞见 AGI 智能体 强化学习 梦境学习 第1张

近期,Andrej Karpathy 在一次播客访谈中,就AI领域的现状与挑战,发表了深刻见解,引起了广泛讨论。

作为AI界的领军人物,Karpathy 的名字在业界具有广泛影响力。他曾担任Tesla Autopilot的负责人、OpenAI的创始团队成员,并创建了备受欢迎的AI启蒙课程CS231n。

在长达两小时的对谈中,Karpathy 首次系统地剖析了当前AI面临的难题,观点新颖且犀利。他认为:

智能体Agent的成熟还需十年;

强化学习不如梦境学习有效;

AI的认知结构尚处于婴儿期;

在Karpathy看来,AI不仅是工具的升级,更是文明的延续。理解并发展AI,意味着在构建“人类文化的接班人”。

智能体,距离成熟还需十年

“我们总是高估短期变化,却低估长期潜力。”

当人们争论AGI何时到来、Agent能力是否已就绪时,前OpenAI研究主管Andrej Karpathy泼了盆冷水——“这不是Agent之年,而是智能体的十年。”

Karpathy明确指出:现有的Agent如Claude、Codex虽令人印象深刻,但离“能雇来做事”还有距离。

他认为:“若将Agent比作实习生,今天的它们根本不够格。缺乏多模态能力、无法持续学习、认知结构不完整、不会记事,甚至难以用电脑干活。”

为何还需十年?

Karpathy认为,Agent的不足不是‘计算力不够’,而是‘认知组件不完整’。

真正能交付成果的Agent,需超越语言模型,拥有持续学习、推理、操作和感知能力。这是一场关于智能构型的系统工程,非短期能达成。

在回答“AGI应像人或动物那样从头学习”时,Karpathy给出了诗意而冷静的回答:

“我们不是在创造动物,而是在创造幽灵。”

这句话背后,是对当前AI训练方式的深刻反思:

动物通过进化获得内建能力,出生即能学习;

大模型通过模仿互联网文本获取知识,靠‘预训练’而非‘成长’建立智能。

换句话说:动物通过ATCG传递本能,人类通过一生体验学习知识,而模型是用数据压缩出的“模糊记忆机器”。

因此,Karpathy认为未来AI的关键研究方向不是让它“知道更多”,而是“能学得更像人”。

大模型还写不了“真正的代码”

在Karpathy构建nanochat的过程中,他深刻体会到:当前LLM在代码生成上存在显著认知缺陷,远未达到“自动化AI工程”的程度。

Karpathy将人与代码的交互分为三类:

1. 纯手写派:完全不用模型,这已过时;

2. 自动补全派:自己写结构,模型补细节(他本人处于此阶段);

3. 氛围编程派(vibe coding):靠自然语言提示生成整段逻辑。

他指出一个核心问题——LLM在结构化、精细化、非模板的工程设计上非常无力。尤其是当你试图做一些“从没写过”的东西时,模型会陷入幻觉。

强化学习很糟糕:人类不会这么学,AI也不该

在谈到AI的学习机制时,Karpathy直言:“强化学习很糟糕。”

这不仅是对算法的批评,更是对整个AI训练范式的一次反思。

在人类世界里,学习往往是复杂、延迟、非线性的。而强化学习(RL)的逻辑与这种认知机制背道而驰。

RL的学习机制像“盲目试错”,即模型尝试上百种路径,只要最后一条成功就奖励整个过程。

问题在于它假设通往正确答案的每一步都是正确的。即使中间九成都是胡乱摸索,因最终结果“对”,系统也会加权这些错误路径。Karpathy形容这种训练方式是:“你花几分钟滚动训练却只通过吸管吸取到一滴奖励信号的监督。”

“做梦”才是AI模型该学的

当我们谈论AGI的路径时,往往纠结于算力、参数、模型结构,却很少真正问:人类究竟是怎么学习的?

Karpathy提醒我们:“大模型所谓的‘读一本书’,只是延长序列长度、预测下一个token。而人类读书是在阅读中思考、在思考中发问、在发问中讨论。”

“你读一本书,和朋友聊这本书,延伸出新的问题与视角,这才是知识的真正入口。”

“智能的偶然,文化的奇迹”

“人类智能并不是宇宙中注定要发生的结果。”Karpathy认为,“智能物种”只出现过一次——人类。

“生命的演化并没有内在目标,智能不是必然终点。”它更像是环境与基因偶然匹配下的一种“岔路产物”。