当前位置:首页 > 科技资讯 > 正文

OpenAI的数学推理革命:从奥数金牌到全能AI智能体

历史总是由无数「意外和巧合」所塑造。

2022年,当研究员Hunter Lightman加入OpenAI时,他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第1张

然而,Lightman却悄悄投身于一个看似不起眼的团队:MathGen。

他们的任务只有一个:训练AI模型去攻克高中级别的数学竞赛难题

如今,这个曾经默默无闻的MathGen团队,被视为OpenAI能够问鼎行业的真正原因!

2023年5月31日OpenAI发布研究博客《Improving Mathematical Reasoning with Process Supervision》,正式提出过程监督(process supervision)训练的效果。

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第2张

并在作者署名中出现Hunter Lightman等与MathGen team有关的研究人员。该博客是首次与MathGen团队相关的官方发布之一。

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第3张

同日,奥特曼于X发布祝贺消息——这是首次由OpenAI亲口确认MathGen Team的官方存在。

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第4张

他们锻造的「AI推理能力」,正是那项终极技术——AI智能体(AI Agent)的心脏!

这种智能体,将像人类一样,在电脑上独立完成你交办的一切任务!

「那时候,AI的数学推理能力简直一塌糊涂!」Lightman回忆道,「我们的使命,就是让它学会真正的思考。」

从「笨学生」到「奥数金牌」的进化!

平心而论,今天的OpenAI模型远未完美——它们依然会「一本正经地胡说八道」,那些所谓的AI智能体在复杂任务面前也常常束手无策。

但是,一场巨变正在发生!

OpenAI最顶尖的模型,其数学推理能力已实现惊天逆袭!

就在最近,OpenAI的一个模型在全球最顶尖的国际数学奥林匹克(IMO)竞赛中,夺得金牌!

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第5张

OpenAI坚信,这种强大的推理能力,将可以复制到任何领域

这正是他们构建通用AI智能体的基石,是他们从创立之初就魂牵梦绕的终极梦想!

如果说,ChatGPT的成功是一场「无心插柳的惊世之作」,一个本想低调测试却意外引爆全球的奇迹。

那么,AI智能体,则是OpenAI精心布局数年、深思熟虑的战略结晶!

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第6张

「未来,你只需要向电脑下达指令,它就会为你搞定一切!」

OpenAI的CEO奥特曼在2023年的开发者大会上宣告,「这种能力,就是AI智能体。它带来的颠覆,将是空前绝后的!」

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第7张

奥特曼的预言能否成真?世界还在观望。但OpenAI已然出手!

2024年秋,其首个AI推理模型o1横空出世,一鸣惊人!

不到一年,缔造这一神话的21名核心研究员,瞬间成为硅谷疯抢的顶尖人物!

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第8张

扎克伯格不惜血本,开出上亿美元的天价薪酬,从OpenAI挖走了5名o1团队的核心成员,组建Meta的「超级智能」军团。

其中一位,清华校友赵晟佳,更是被直接任命为Meta超级智能实验室的首席科学家

强化学习:引爆智能革命的古老技艺

OpenAI的数学推理革命:从奥数金牌到全能AI智能体 OpenAI AI智能体 数学推理 通用AI 第9张