编者按:2025年终策划《定力与重构》,回望与展望:洞察本质,向变革寻求确定。
在2025年,我深入研读了约两百篇人工智能领域的论文,这一年可以被称为「暴力美学」时代的终结。单纯依靠堆砌参数摘取低垂果实的日子已经过去,技术进化回归到了基础研究。
这篇文章,我想通过梳理这一年的技术脉络,明确三个结论:
第一,技术进步主要集中在流体推理(Fluid Reasoning)、长期记忆(Long-term Memory)、空间智能(Spatial Intelligence)以及元学习(Meta-learning) 这四个领域。原因在于单纯的参数规模遇到了边际效应递减,为了突破AGI的瓶颈,业界转向寻找新的增长点。
第二,现在的技术瓶颈主要在模型要“不仅要博学,更要懂思考和能记住”。通过Yoshua Bengio提出的AGI框架,我们发现之前的AI存在严重的「能力偏科」:在一般知识上得分极高,但在即时推理、长期记忆和视觉处理上几乎是空白。这种不平衡构成了通往AGI的最大阻碍。
第三,这些瓶颈在25年其实都找了一些新的解决方向。其中最重要的是三个方面:推理能力、记忆能力和空间智能。
● 推理能力:通过Test-Time Compute引发的革命,AI学会了慢思考,推理能力实现了质变。
● 记忆能力:Titans架构和Nested Learning的出现,打破了Transformer的无状态假设,让模型具备了内化的“海马体”。
● 空间智能:视频生成开始掌握物理规律,迈向真正的世界模型。
接下来,我将根据这一年间的论文阅读,带领大家详细看看这些关键拼图是如何被一块块补齐的。
在2024年,AI明显的短板是即时推理 (R)能力。而在2025年,Test-Time Compute通过拉长推理时间来换取智能。Test-Time Compute的核心理念是:智能不仅是参数的函数,也是时间的函数。以OpenAI o1和DeepSeek R1为代表,AI学会了「慢思考」。
这就是2025年最重要的范式革新,让AI从背书的鹦鹉转向思考的机器。
如果说Test Time Compute是前半年最重要的模型变革,那后半年最重要的模型变革,就是记忆能力的提升。
模型,获得活着的记忆
Titans是一个深度的神经长期记忆模块,能够在测试时实时更新自身的参数。这与传统的Transformer层完全不同。Titans在一开始就是个空容器,将历史信息学习进神经记忆中。
在Sora 2、Veo 3等生成视频的爆发之下,视觉处理得到了有效提升。虽然主要是李飞飞在宣扬空间智能的概念,但实际在这一路上有三个主流派系和玩家各有研究进展。
从深度学习肇始,核心问题就只有一个,即什么是学习。到2024年为止,大模型已经具有了很多学习能力。然而,强化学习之父 Richard Sutton 依然批评当前的大语言模型(LLM)只是“被冻结的过去知识”,缺乏在与环境交互中实时学习的能力。
在2025年,也有一些其他重要改变有效的补齐了过去模型并不擅长的领域。对抗“Scaling Law的消失”、感谢蒸馏、注意力机制的变化等。
本文由主机测评网于2026-06-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260647935.html