
在最新一期播客节目中,菲尔兹奖得主陶哲轩分享了他对人工智能的深刻洞察:AI最令人担忧的并非能力不足,而是它犯错时伪装得天衣无缝。
陶哲轩指出,AI能够构建出逻辑严密、术语精准的推理链条,语气充满自信,让人初读之下难以生疑。然而,问题在于:你无法确认真伪。它为何如此推导?若有谬误,谁能察觉?能否复现其过程?能否通过验收?这些根本性问题,在AI落地时立刻凸显,这已超越技术层面,直指责任归属。陶哲轩从三个维度剖析:AI如何模仿、为何缺乏判断、以及验证为何困难。他的核心结论是:当AI的输出日益逼真,辨别其正确与否的能力,将成为最稀缺的资源。本文聚焦于一个核心问题:你是否有能力确认AI没有犯错?
陶哲轩认为,当前AI处理数学问题时,看似无所不能,实则对其行为毫无真正理解。它能生成貌似严谨的证明,包含定理、步骤与结论,语气自然流畅。但若深入追问“为何如此推导”,便会发现其答案逻辑混乱,完全不知所云。AI更像一位紧张的学生,在黑板上快速拼凑训练中见过的片段,却无法自证推理的合理性。
更棘手的是,我们难以判断AI究竟是真正推导,还是仅仅复述训练数据。陶哲轩称之为“数据污染”:教科书中的定理与例题,AI在训练时已悉数见过。它可能只是在重复记忆,而非思考。这也是大模型在专业领域的通病:善于模仿,但缺乏判断力。
人类解数学题时,依赖基本直觉;而AI缺乏这种直觉。它仅基于海量语料,预测最可能出现的下一个词。其输出并非逻辑,而是统计概率。这导致一个危险后果:模型表达越自然,我们越易轻信,而忽略核查每一步推理的真实性。尤其在数学中,一环出错,全盘皆输。AI不会指出错误,甚至不自知。陶哲轩最担忧的,并非AI错得离谱,而是错得过于逼真。
“那它为何能错得如此逼真?”陶哲轩看来,AI在数学上的表现,不仅是逻辑缺失,更根本的是对问题缺乏理解。真正懂数学的人面对新问题时,首先会思考:这个问题值得解吗?它与哪些已知知识相关?有哪些定理或公式可资利用?而AI没有这种判断能力。它引用某个定理,并非因理解其关键作用,而是因见过类似证明,便机械模仿。
陶哲轩强调,AI缺乏价值判断,不知何事重要,也不知哪些问题更值得探索。数学中最难的并非“怎么做”,而是“做什么”。真正的突破,常源于提出无人想到的问题。而AI只能解决现成问题,无法提出新问题。这揭示了AI的本质:它能帮你回忆已知,但你必须自行判断真伪与价值。AI不知轻重,不是不会做,而是不知该做什么——因为它没有动机。
即便AI知晓该做什么,更致命的问题在于:它产出的内容往往经不起检验。在数学中,答案仅是起点,真正的关键在于推导过程。结论成立,不是因其听起来合理,而是因其可追溯、可验证。数学家也会犯错,但人类证明的优势在于推导清晰,同行能发现漏洞。而AI的产出缺乏这种可追溯性。
这不仅是数学问题。律师用AI生成法律文书,却发现引用的判例子虚乌有,有律师因此被法庭罚款。程序员用AI写代码,表面能运行,却暗藏安全漏洞,上线后造成损失。金融分析师用AI生成投资报告,数据来源与计算逻辑模糊,谁敢据此决策?问题的核心一致:AI给出“看似正确”的结果,但每一步的可靠性难以验证。
怎么办?陶哲轩的答案是:只在你能验证的范围内使用AI。换言之,不是不用AI,而是必须将AI与验证工具配对。AI负责生成,人类或自动验证系统负责检查。超出验证能力的部分,切勿涉足。
在此前提下,AI的价值何在?陶哲轩认为,AI的真正价值,不在于攻克顶级难题,而在于处理海量中等难度问题——这些问题数量庞大,人类研究者无力全盘顾及,但AI可批量处理。即使仅解决其中10%,也是10万个已解问题。
在日常研究中,AI也能发挥辅助作用,如文献综述:某类问题可能有十几种解法,你记得六个,忘了另外六个,AI可提醒遗漏的方法——尽管它也可能幻觉出三个不存在的解法,因此必须验证。AI甚至能帮人发现隐藏规律。陶哲轩举例:纽结理论中,神经网络从多个不变量中高精度预测出“signature”不变量。起初是黑箱,但研究者通过分析黑箱,反推出背后的数学关系,最终证明了它。
这才是AI的正确用法:不是直接给答案,而是提供线索、指出可能性,由人类去判断、验证、决策。无论是数学研究、法律文书、代码审查,还是投资分析,AI适合当批量处理工具和辅助工具,而非最终决策者。前提是:有人能验收其产出,确认哪些可用。
用AI,可以。但要记住:信任,但必须验证。
AI最危险的,不是它不会,是它表现得像会。它能写出看似完整的推理,却说不清为什么;它能复述训练数据,却判断不了重要性;它能排列推理格式,却经不起逐步检查。你很难从表面判断:它是真懂,还是照搬?是在推理,还是东拼西凑?
这才是陶哲轩真正担心的事:AI做得越像真的,你就越容易信它。但它错得也越像对的,你就越难发现。
https://www.youtube.com/watch?v=ukpCHo5v-Gc&t=1614s
https://pmc.ncbi.nlm.nih.gov/articles/PMC5352490/?utm_source=chatgpt.com
https://www.lingexp.uni-tuebingen.de/z2/Morphology/baroni.rows
https://x.com/DrBrianKeating
https://mathstodon.xyz/%40tao/114967652676795985
本文由主机测评网于2026-03-13发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260331078.html