当前位置：首页 > 科技资讯 > 正文

陶哲轩警告：AI的危险不在于无知，而在于错得逼真

主机测评网
科技资讯
2026-03-13
975

陶哲轩警告：AI的危险不在于无知，而在于错得逼真 AI安全陶哲轩验证能力模仿风险第1张

在最新一期播客节目中，菲尔兹奖得主陶哲轩分享了他对人工智能的深刻洞察：AI最令人担忧的并非能力不足，而是它犯错时伪装得天衣无缝。

陶哲轩指出，AI能够构建出逻辑严密、术语精准的推理链条，语气充满自信，让人初读之下难以生疑。然而，问题在于：你无法确认真伪。它为何如此推导？若有谬误，谁能察觉？能否复现其过程？能否通过验收？这些根本性问题，在AI落地时立刻凸显，这已超越技术层面，直指责任归属。陶哲轩从三个维度剖析：AI如何模仿、为何缺乏判断、以及验证为何困难。他的核心结论是：当AI的输出日益逼真，辨别其正确与否的能力，将成为最稀缺的资源。本文聚焦于一个核心问题：你是否有能力确认AI没有犯错？

第一节：模仿｜AI在复制思维的表象

陶哲轩认为，当前AI处理数学问题时，看似无所不能，实则对其行为毫无真正理解。它能生成貌似严谨的证明，包含定理、步骤与结论，语气自然流畅。但若深入追问“为何如此推导”，便会发现其答案逻辑混乱，完全不知所云。AI更像一位紧张的学生，在黑板上快速拼凑训练中见过的片段，却无法自证推理的合理性。

更棘手的是，我们难以判断AI究竟是真正推导，还是仅仅复述训练数据。陶哲轩称之为“数据污染”：教科书中的定理与例题，AI在训练时已悉数见过。它可能只是在重复记忆，而非思考。这也是大模型在专业领域的通病：善于模仿，但缺乏判断力。

人类解数学题时，依赖基本直觉；而AI缺乏这种直觉。它仅基于海量语料，预测最可能出现的下一个词。其输出并非逻辑，而是统计概率。这导致一个危险后果：模型表达越自然，我们越易轻信，而忽略核查每一步推理的真实性。尤其在数学中，一环出错，全盘皆输。AI不会指出错误，甚至不自知。陶哲轩最担忧的，并非AI错得离谱，而是错得过于逼真。

第二节：动机｜AI无法解释为何如此

“那它为何能错得如此逼真？”陶哲轩看来，AI在数学上的表现，不仅是逻辑缺失，更根本的是对问题缺乏理解。真正懂数学的人面对新问题时，首先会思考：这个问题值得解吗？它与哪些已知知识相关？有哪些定理或公式可资利用？而AI没有这种判断能力。它引用某个定理，并非因理解其关键作用，而是因见过类似证明，便机械模仿。

陶哲轩强调，AI缺乏价值判断，不知何事重要，也不知哪些问题更值得探索。数学中最难的并非“怎么做”，而是“做什么”。真正的突破，常源于提出无人想到的问题。而AI只能解决现成问题，无法提出新问题。这揭示了AI的本质：它能帮你回忆已知，但你必须自行判断真伪与价值。AI不知轻重，不是不会做，而是不知该做什么——因为它没有动机。

第三节：验证｜AI的成果经不起检验

即便AI知晓该做什么，更致命的问题在于：它产出的内容往往经不起检验。在数学中，答案仅是起点，真正的关键在于推导过程。结论成立，不是因其听起来合理，而是因其可追溯、可验证。数学家也会犯错，但人类证明的优势在于推导清晰，同行能发现漏洞。而AI的产出缺乏这种可追溯性。

这不仅是数学问题。律师用AI生成法律文书，却发现引用的判例子虚乌有，有律师因此被法庭罚款。程序员用AI写代码，表面能运行，却暗藏安全漏洞，上线后造成损失。金融分析师用AI生成投资报告，数据来源与计算逻辑模糊，谁敢据此决策？问题的核心一致：AI给出“看似正确”的结果，但每一步的可靠性难以验证。

怎么办？陶哲轩的答案是：只在你能验证的范围内使用AI。换言之，不是不用AI，而是必须将AI与验证工具配对。AI负责生成，人类或自动验证系统负责检查。超出验证能力的部分，切勿涉足。

在此前提下，AI的价值何在？陶哲轩认为，AI的真正价值，不在于攻克顶级难题，而在于处理海量中等难度问题——这些问题数量庞大，人类研究者无力全盘顾及，但AI可批量处理。即使仅解决其中10%，也是10万个已解问题。

在日常研究中，AI也能发挥辅助作用，如文献综述：某类问题可能有十几种解法，你记得六个，忘了另外六个，AI可提醒遗漏的方法——尽管它也可能幻觉出三个不存在的解法，因此必须验证。AI甚至能帮人发现隐藏规律。陶哲轩举例：纽结理论中，神经网络从多个不变量中高精度预测出“signature”不变量。起初是黑箱，但研究者通过分析黑箱，反推出背后的数学关系，最终证明了它。

这才是AI的正确用法：不是直接给答案，而是提供线索、指出可能性，由人类去判断、验证、决策。无论是数学研究、法律文书、代码审查，还是投资分析，AI适合当批量处理工具和辅助工具，而非最终决策者。前提是：有人能验收其产出，确认哪些可用。

用AI，可以。但要记住：信任，但必须验证。