智能模型的科学之旅:从分歧到趋同的奥秘!MIT最新研究揭示,模型越强大,对物质的理解就越趋向一致。算力竞赛或可转向更务实的路径。
当前AI for Science的现状,犹如一场「跨界对话」,各模型以不同语言描述同一科学现象。
有的依赖SMILES字符串,有的则关注原子的3D坐标,它们在各自的赛道上比拼预测精度。
但核心疑问浮现:这些AI是在「找规律」,还是真的理解了背后的物理法则?
论文链接:https://arxiv.org/abs/2512.03750
结果令人惊讶:尽管模型的数据解读方式千差万别,但当它们变得足够强大时,对物质的理解却变得惊人地相似。
更引人注目的是,一个处理文字的代码模型,与一个计算受力的物理模型,在「认知」层面竟高度一致。
它们沿着不同的路径,登上了同一座知识的高峰,共同绘制着物理与现实的「终极地图」。
为了验证这些模型是否真在逼近真理,研究者引入了一个关键指标:表征对齐度。
简而言之,就是观察两个模型在处理同一分子时,它们的思维逻辑有多相似。
研究发现,性能越强的模型,其思维方式就越接近。
性能与认知的同步:随着能量预测准确度的提升,这些模型在表达空间上会自发靠拢。每个点代表一个模型,点大小对应模型规模。
尽管这些AI的架构各异,但在处理同一批分子数据时,其特征空间的复杂度却惊人地压缩到一个很窄的范围。
无论模型外壳多么复杂,它们最终捕捉的都是最核心、最精炼的物理信息。
在跨架构的表征对齐研究中,发现高性能模型如Orb V3与严谨物理模型(如MACE、EqV2)之间存在强烈共鸣。
通过更灵活的训练,这些模型能更精准地对齐物理规律。
这表明,当AI获得足够多的数据和恰当的训练方式时,它甚至能超越现有公式,自行探索物质运行的本质规律。
你以为这种「共识」只限于科学AI?其实并非如此!
研究发现,纯文本的语言模型(如GPT系列)和纯图像的视觉模型(如CLIP或DALL·E背后的模型),对「猫」的理解也越来越相似。
在语言模型中,「猫」的向量表示会靠近「毛茸茸」「喵喵叫」「宠物」「抓老鼠」等词汇。
而在视觉模型中,「猫」的向量则靠近其视觉特征如胡须、圆眼睛、软毛、优雅的尾巴等。
尽管这两个模型一个看文字、一个看图片,看似无交集。
但随着模型规模扩大、性能增强,这两个不同模态的「猫」表示在空间中越来越近,仿佛在共享同一个「猫的本质」!
高性能模型在山顶汇合,那表现不佳的模型呢?
研究发现,性能不佳的模型有两种「死法」:一种是各想各的,越走越远;另一种则是集体变笨,虽然想法一致但遗漏关键信息。
图中白色点代表模型从未见过的分子结构。可见,这些模型在处理这些结构时误差激增,且表征完全偏离正常物理分布。
既然实验证明不同AI都在向同一物理理解靠拢,我们还有必要堆昂贵的显卡从头训练大模型吗?
答案显然是没有。而且AI已为我们找到捷径——「模型蒸馏」。
图中圆点大小代表模型参数量。可见,即使较小的模型,只要其表征能与最佳性能模型对齐,同样能在分子能量预测任务中表现惊人。
本文由主机测评网于2026-06-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260647851.html