当前位置:首页 > 科技资讯 > 正文

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波

GPT-5引发了一场闹剧,令OpenAI陷入尴尬境地!最初,所有人都误以为GPT-5成功破解了十道埃尔德什难题,不料它仅是透过查阅文献提供答案。谷歌DeepMind CEO Demis Hassabis对此点评,这实在令人难堪。

OpenAI团队先前大肆鼓吹GPT-5的能力,结果却演变成一场乌龙事件......

事件的起因如下。

几天前,OpenAI科学家Sebastien Bubeck激动地转发消息,称两位研究员与GPT-5 Pro联手,仅用一个周末就解决了10个「百年悬案」——即埃尔德什难题(Erdos problems)。随后,OpenAI科学副总裁Kevin Weil等人纷纷加入,进行高调宣传。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第1张

然而,真相迅速曝光:这十道难题实际上早已被学术界解决,GPT-5并非独立攻克,而是通过检索网络文献获取了答案。

消息传出后,舆论一片哗然。连谷歌DeepMind CEO Demis Hassabis也忍不住评价,「这真是太尴尬了」。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第2张

此外,图灵奖得主LeCun也现身X平台嘲讽道,「这简直是搬起石头(GPT)砸自己的脚」。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第3张

GPT-5闹剧:一场自导自演的误会

这场风波,可说是OpenAI团队的自导自演所致。

研究人员Mark Sellke和Mehtaab Sawhney的发文原本很明确,并未声称GPT-5破解了难题。他们原帖指出,通过GPT-5进行数千次查询后,找到了十个被列为埃尔德什问题的解决方案。

当时的结果显示,问题223、339、494、515、621、822、883、903、1043、1079均被解决,同时在另外11个问题上也取得了部分进展。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第4张

另一方面,这十道难题其实早已有答案,只是网站管理者未能及时更新状态。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第5张

传送门:https://www.erdosproblems.com/

英国皇家学会研究院Thomas Bloom,作为网站erdosproblems.com的运营者,对此并不知情。网站上,「开放」状态仅代表他个人不了解该问题的解法,而非表示该问题在科学界尚未被解决。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第6张

总而言之,两个误会叠加在一起,导致了人们的「幻觉」——误以为GPT-5攻克了埃尔德什难题。一是难题并非未解,只是网站维护者不清楚;二是GPT-5仅通过搜索文献完成,并非自主解决。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第7张

Sebastien Bubeck尴尬地回应道,GPT-5只是在文献中找到了解决方案,仅此而已。即便如此,他认为这一过程已非常高效,因为搜索文献本身通常极为困难。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第8张

网友热议:强调同行评审的重要性

评论区的大佬们,正坐在前排密切关注此事。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第9张

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第10张

通过这场争论,开发者Matt Mazur严肃地表示,所有人都必须谨慎对待任何关于AI发现新科学或数学成果的说法。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第11张

Hyperbolic创始人Yuchen Jin称,「关于AI在科学或数学领域的新发现,需要更多的同行评审来验证」。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第12张

不过也有人认为,这对GPT-5来说并不尴尬,毕竟它在文献检索方面表现依然出色。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第13张

几天前,陶哲轩也曾发文表示,他越来越觉得,眼下AI要在数学领域真正发挥作用,关键可能不在用最顶尖的模型去攻克最难的题目——当然偶尔会有此类案例,特别是当人们投入大量算力和专家精力时。但更可行的路线,反而是用中等水平的AI工具,协助研究人员处理那些琐碎而必要的体力活。

GPT-5误破解埃尔德什难题闹剧真相:一场由宣传与误会引发的AI科研风波 GPT-5  埃尔德什难题 OpenAI AI科研辅助 第14张

无论何时,对AI的原创发现保持审慎都是首要原则,但这并不妨碍AI辅助科研成为未来发展的必经之路。

参考资料:

https://x.com/SebastienBubeck/status/1979539604522127746

https://x.com/thomasfbloom/status/1979254235075059732