GPT-5引发了一场闹剧,令OpenAI陷入尴尬境地!最初,所有人都误以为GPT-5成功破解了十道埃尔德什难题,不料它仅是透过查阅文献提供答案。谷歌DeepMind CEO Demis Hassabis对此点评,这实在令人难堪。
OpenAI团队先前大肆鼓吹GPT-5的能力,结果却演变成一场乌龙事件......
事件的起因如下。
几天前,OpenAI科学家Sebastien Bubeck激动地转发消息,称两位研究员与GPT-5 Pro联手,仅用一个周末就解决了10个「百年悬案」——即埃尔德什难题(Erdos problems)。随后,OpenAI科学副总裁Kevin Weil等人纷纷加入,进行高调宣传。
然而,真相迅速曝光:这十道难题实际上早已被学术界解决,GPT-5并非独立攻克,而是通过检索网络文献获取了答案。
消息传出后,舆论一片哗然。连谷歌DeepMind CEO Demis Hassabis也忍不住评价,「这真是太尴尬了」。
此外,图灵奖得主LeCun也现身X平台嘲讽道,「这简直是搬起石头(GPT)砸自己的脚」。
这场风波,可说是OpenAI团队的自导自演所致。
研究人员Mark Sellke和Mehtaab Sawhney的发文原本很明确,并未声称GPT-5破解了难题。他们原帖指出,通过GPT-5进行数千次查询后,找到了十个被列为埃尔德什问题的解决方案。
当时的结果显示,问题223、339、494、515、621、822、883、903、1043、1079均被解决,同时在另外11个问题上也取得了部分进展。
另一方面,这十道难题其实早已有答案,只是网站管理者未能及时更新状态。
传送门:https://www.erdosproblems.com/
英国皇家学会研究院Thomas Bloom,作为网站erdosproblems.com的运营者,对此并不知情。网站上,「开放」状态仅代表他个人不了解该问题的解法,而非表示该问题在科学界尚未被解决。
总而言之,两个误会叠加在一起,导致了人们的「幻觉」——误以为GPT-5攻克了埃尔德什难题。一是难题并非未解,只是网站维护者不清楚;二是GPT-5仅通过搜索文献完成,并非自主解决。
Sebastien Bubeck尴尬地回应道,GPT-5只是在文献中找到了解决方案,仅此而已。即便如此,他认为这一过程已非常高效,因为搜索文献本身通常极为困难。
评论区的大佬们,正坐在前排密切关注此事。
通过这场争论,开发者Matt Mazur严肃地表示,所有人都必须谨慎对待任何关于AI发现新科学或数学成果的说法。
Hyperbolic创始人Yuchen Jin称,「关于AI在科学或数学领域的新发现,需要更多的同行评审来验证」。
不过也有人认为,这对GPT-5来说并不尴尬,毕竟它在文献检索方面表现依然出色。
几天前,陶哲轩也曾发文表示,他越来越觉得,眼下AI要在数学领域真正发挥作用,关键可能不在用最顶尖的模型去攻克最难的题目——当然偶尔会有此类案例,特别是当人们投入大量算力和专家精力时。但更可行的路线,反而是用中等水平的AI工具,协助研究人员处理那些琐碎而必要的体力活。
无论何时,对AI的原创发现保持审慎都是首要原则,但这并不妨碍AI辅助科研成为未来发展的必经之路。
https://x.com/SebastienBubeck/status/1979539604522127746
https://x.com/thomasfbloom/status/1979254235075059732
本文由主机测评网于2026-01-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260116782.html