当前位置:首页 > 科技资讯 > 正文

GPT-5 揭秘:通用验证器与 AI 进化新纪元

目前,整个 AI 领域似乎都沉浸在 GPT-5 的期待中,各种传闻纷至沓来,但模型本身却迟迟未现身。

我们曾报道了 The Information 揭露的 GPT-5 背后的秘密,而奥特曼也按捺不住,在推特上表示「惊喜连连,值得期待」。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第1张

在等待的这段时间里,我们来看看这次 GPT-5 的「疑似亮点」之一:通用验证器(universal verifier)。

有知情人士透露,OpenAI 一直在研发一种被称为「通用验证器」的技术,这可能是 GPT-5 中的关键技术。

这一概念源自 OpenAI 去年发表的一篇论文。它解决的问题是:当 LLM 仅优化答案正确性时,其推理过程(如 Chain-of-Thought)变得难以被人类或小型模型理解和验证,导致「可解释性」下降。但在高风险应用中,用户需要能迅速、准确地判断模型输出是否正确,而不仅仅是答案本身。

为此,该论文提出了一套即将投入生产的技术方案,其核心在于:通过一个小规模的「验证者」模型为大模型的推理链打分,并将其作为奖励信号反馈给大模型进行策略更新。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第2张

论文标题:Prover-Verifier Games improve legibility of LLM outputs

论文地址:https://arxiv.org/pdf/2407.13692

论文明确指出,这个验证者模型足够小,适合大规模部署,且专为未来的 GPT 部署而设计。

你可以想象成模型内有两个「角色」,它们在进行一场持续的「内部对抗」:

  • 「证明者」角色(Prover):它积极解决问题,在完成任务后,会生成详细的推理过程,试图说服轻量级的「验证者」网络,证明自己的答案是正确且可靠的。
  • 「欺骗者」角色(Sneaky Persona):它会故意在推理中植入错误结论,但表面逻辑依然严密,试图骗过同一个「验证者」。

听起来是不是很像 GAN(生成对抗网络)?

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第3张

通过让大模型在这两个角色之间不断切换,它既能学会写出更严谨、更难伪造的解决方案。同时,小规模「验证者」模型在反复的「欺骗」与「验证」中,其识别错误、标记漏洞的能力也愈发敏锐。这样做的好处在于,即使未来模型远超人类能力,只要其输出能被「较弱但可信」的模型验证,就能保持人类对其的控制与信任。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第4张

论文提出的训练方法能让模型逐步学会生成清晰且结构良好的答案。

去年 8 月,《连线》杂志的一篇文章透露,OpenAI 在微调 GPT-4 的代码助手时,就已经用基于模型的「批评家」替代了部分场景下的人类反馈。

文章特别指出,该系统「将被整合到未来主流模型的 RLHF(基于人类反馈的强化学习)流程中」。

有人评论说,「证明者 - 验证者」训练方法不仅仅是一个小优化,它可能代表了 AI 发展的下一个时代。我们正在从依赖海量数据、靠「堆料」来提升性能的「扩展时代」,转向通过设计更智能的内部学习机制、让 AI 自我完善和进化的「架构突破」时代。这可能是我们突破当前数据瓶颈、实现更高级别通用人工智能的关键路径。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第5张

值得一提的是,这篇论文来自 OpenAI 的超级对齐团队。在论文发布时,团队已经解散。去年,《机器之心》曾详细报道过这篇论文。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第6张

除了论文之外,GPT-5 模型也有了一些新消息。

今天早些时候,有博主发现 Perplexity 存在漏洞可以访问 GPT-5,并且存在 GPT-5 和 5 Pro 两个版本,限时 4 小时。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第7张_oswg3_img_0?x-oss-=image/,jpg/,1" alt="GPT--相关图片"/>

他展示了自己用 GPT--生成的小黄人动画效果非常流畅。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第8张-val=" " src="https://img.36krcdn.com//v2__b1e@_img_?x--process=image/,jpg/,1" alt="GPT--相关图片"/>

他还制作了一段类似 Doom(FPS 游戏)的游戏片段,看起来非常逼真。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第9张-size--val=" " src="https://img.36krcdn.com//v2__8@_img_?x--process=image/,jpg/,1" alt="GPT--相关图片"/>

网友们纷纷表示「震惊」,认为这是 AI 生成的「新时代」。

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第9张-size--val=" " src="https://img.36krcdn.com//v2__ce@_oswg8_img_?x--process=image/,jpg/,1" alt="GPT--相关图片"/>

GPT-5 揭秘:通用验证器与 AI 进化新纪元 通用验证器 AI进化 可解释性 第9张-size--val=" " src="https://img.36krcdn.com//v2__ce@_oswg8_img_?x--process=image/,jpg/,1" alt="GPT--相关图片"/>

总之,大家对 GPT--的期待已经爆棚!

你觉得 GPT--会是个什么样子?