当前位置:首页 > 科技资讯 > 正文

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象

基于大型语言模型(LLM)的智能体正展现出卓越能力,逐渐成为应对复杂挑战的强大方法。

然而,这种成功目前仍更多依赖于工程实践中的经验性探索——我们知晓其有效性,但往往难以从宏观层面理解其运作机制。那么,能否找到一个理论框架,类似物理学描述自然规律那样,来统一解释智能体的宏观动力学行为?

为了揭开这一黑盒,近期,北京大学物理学院、高能物理研究中心与北京计算科学研究中心携手合作,跨学科引入了物理学中经典的最小作用量原理。他们提出一种创新方法,成功估测了嵌入智能体的LLM隐藏的生成方向性,揭示了AI生成过程背后可能存在的“物理法则”。

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第1张

论文标题:Detailed balance in large language model-driven agents论文地址:https://arxiv.org/pdf/2512.10047

简而言之,团队通过实验测量了LLM生成状态之间的转移概率。基于此,他们从统计角度发现了LLM生成转移中存在的细致平衡现象。

这暗示:LLM的生成可能并非通过一般性学习规则集和策略来实现,而是隐式地学习了一类潜在的势函数,这些函数可能超越了不同的LLM架构和提示词模板。

研究团队指出:“据我们所知,这是首次在不依赖特定模型细节的情况下,揭示LLM生成动力学中的宏观物理定律。”

这意味着什么?通俗解释,该研究发现AI的思考并非“机械记忆”,而是像水流向低处一样遵循“物理本能”。

确实,LLM智能体在解决问题时,其行为模式并不像许多人认为的那样仅仅是匹配规则或随机试探,而是隐约感知到一张无形的地形图(即势函数)。在这张图中,错误答案类似高地,而正确答案则是低谷。智能体的每一次推理和生成,实际上都是在最小作用量原理的驱动下,自然地向势能更低、质量更优的状态流动。

这表明,AI能够处理复杂问题,是因为它在海量参数中内化出了一种全局“直觉”,这也是科学家首次在AI生成过程中发现不依赖于特定模型的宏观物理规律。

这一发现将AI研究从“经验炼丹”提升到了可量化的“物理科学”层面。通过验证物理学中的“细致平衡”现象,团队证实了AI的思维跃迁并非无章可循,而是像热力学平衡系统一样遵循严格的数学比例。

这使得我们可以用物理指标为不同大模型“画像”;例如,研究显示:

Claude-4 类似急于交卷的优等生,倾向于快速收敛到某个答案(势井),但也容易固守己见;

GPT-5 Nano 则像一位探险家,虽然收敛较慢,但更乐于在状态空间中广泛探索,寻找未知可能性。

这一理论框架让我们能够以科学测量的方式预测和控制AI行为,不再仅仅依赖盲目的工程试错。正如谷歌近期一篇论文所展现的(参阅报道《谷歌发布智能体 Scaling Law:180 组实验打破传统炼金术》),AI智能体研究正从简单的工程实践,转向建立在有效测量基础上的、可预测且可量化的科学。

下面具体探讨北大团队的核心发现。

理论框架

为严谨表述问题,团队研究的是核心由一个或多个LLM构成的智能体。

该智能体以当前状态 f 作为输入,通过一系列确定性步骤对状态进行组织与评估,生成相关提示词。随后,提示词被输入到一个或多个LLM中,其结构化输出经解析后得到新状态 g。此状态是研究LLM动力学的最小单元。

这种生成过程可视为状态空间 𝒞 中的马尔可夫转移过程,其转移核为 P (g|f),保留了LLM生成的多样性和适应性。状态由智能体在每个时间步保留的完整信息定义,应包含智能体执行连续推理或类比过程所需的所有信息。本文中,智能体仅包含LLM的单个生成步骤,记 𝒯(g←f)=P (g|f) 为智能体通过LLM生成从包含状态 f 的模板转移到包含状态 g 的输出的概率。

图1展示了这一过程的示意图。

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第2张

基于LLM的智能体的特点是,其状态转移并非完全随机,而是表现出某种结构化偏好。

具体而言,智能体倾向于从当前状态 f 转移到从智能体视角视为“更优”的状态 g。

为捕捉这一现象,假设存在一个潜在势函数 V_𝒯:𝒞→ℝ,它为每个状态分配一个标量值以反映其“质量”。由于特定势函数通常难以直接计算,研究者提出了一种有效估计该势函数的方法。

给定一个全局势函数 V,研究者将智能体的给定转移 𝒯(g←f) 对势函数的违背定义为 K (V (f)−V (g)),其中 K (x) 是一个凸函数,用于描述从状态 f 到状态 g 的转移在多大程度上违背了势函数 V 的排序。为量化智能体行为与势函数之间的整体不匹配度,研究者以转移核 𝒯(g←f) 为权重,将作用量 𝒮 定义为全局平均违背:

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第3张

其中 Df,Dg 是状态空间上的测度。本文中,研究者选择 K (x)=exp (-βx/2) 作为描述给定状态转移 f 到 g 违背标量函数 V 排序程度的凸函数。作用量 S 或 βV (f) 的分布形状可以代表该状态空间 C 内智能体的全局认知能力。

研究者提出,若要利用势函数量化 LLM 的行为,可以寻找一个使智能体转移与势函数之间的整体不匹配度最小化的势函数。因此,描述给定状态空间中基于 LLM 的智能体𝒯 最合适的势函数 V_𝒯 ,是那个能使作用量 S 最小化的函数。

这意味着作用量满足关于势函数 V_𝒯 的变分原理:

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第4张

该变分条件等价于 V_𝒯 满足以下平衡条件:

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第5张

这对所有 f∈C 成立,其中 K"(x)=dK/dx。

具体而言,如果对于所有转移 𝒯(g←f)>0,均有 V (f)≥V (g) 成立,则表明智能体的状态转移是完全有序的,在此情况下,V 充当李雅普诺夫函数。

值得注意的是,如果 𝒯 描述的是一个平衡系统的转移,其状态转移满足细致平衡条件,即对于所有状态对 (f,g),下式成立:

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第6张

其中 π(f) 表示系统在状态 f 处的平衡分布,而 P (g|f) 表示转移核。在这种情况下,存在一个势函数 V 可以明确地将细致平衡表示为:

AI智能体遵循物理定律?北大团队揭示LLM生成中的细致平衡现象 LLM智能体  最小作用量原理 细致平衡 势函数 第7张

代入 (3) 式,可以验证该势函数 V=V_𝒯 满足最小作用量原理。这表明对于平衡系统,如果存在细致平衡条件,则可以通过最小作用量原理估计其潜在的势函数。在一般情况下,最小作用量仅仅是在寻求势函数的最有序排列,从而最小化智能体状态转移对该排列的违背。

研究者指出,基于 LLM 的智能体在其 LLM 生成的状态空间中,往往表现得像一个平衡系统,该状态空间相较于 LLM 完整的生成序列是粗粒化的。这一现象的存在表明 LLM 生成动力学中存在一种不依赖于具体模型和任务细节的普遍宏观规律。这表明,尽管看似无关,但在不同的 LLM 生成过程之间存在潜在的联系,使我们能够通过势函数 V_𝒯 描述 LLM 生成中的全局有序性,从而为 LLM 的内部动力学提供解释。

结论与展望

在本文中,研究者提出了一种基于最小作用量原理的框架,旨在描述和分析基于 LLM 的智能体在其 LLM 生成的状态空间中的生成动力学。

通过在多个不同模型和任务上的实验验证,研究者发现这些智能体的状态转移在很大程度上满足细致平衡条件,这表明它们的生成动力学表现出类似于平衡系统的特征。研究者进一步通过最小作用量原理估计了底层的势函数,并揭示了其在捕捉 LLM 生成动力学内在方向性方面的重要作用。

研究者对发现 LLM 生成动力学中的宏观规律进行了初步探索。

该团队也展望了未来:“未来的工作可以进一步扩展这一框架,并探索利用更多来自平衡及近平衡系统的工具,以理解和优化 LLM 的生成过程。例如,研究偏离平衡的程度可能有助于我们理解模型的过拟合水平,因为过拟合的模型可能会学习更多局部的策略集,而不是由势函数支配的全局生成模式。此外,基于势函数的优化方法也可能为提高 LLM 任务相关生成的质量和多样性提供新思路,例如根据不同的安全性和探索需求调整不同幅度的作用量。”