智东西9月18日消息,今日凌晨,OpenAI与谷歌相继宣布,其模型在全球顶级编程赛事ICPC 2025(第49届国际大学生程序设计竞赛)总决赛中取得了金牌级表现。
OpenAI的推理系统成功解答了所有12道题目,一次性答对11道,并经过9次尝试成功解决了最难题,与人类团队相比位列第一;谷歌的Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,排名人类团队之后,位列第二。
若将AI纳入ICPC总排名,前三甲应是:OpenAI推理系统、圣彼得堡国立大学、谷歌Gemini 2.5 Deep Think高级版本。
ICPC要求参赛者在5小时内解决12道复杂的算法问题,解题的完整性和时间都会影响积分。
最终,139支队伍中,前4名获得金牌,分别是圣彼得堡国立大学、东京大学、北京交通大学、清华大学,其中圣彼得堡国立大学解决了最多的题目,共11道。
这是继两个月前OpenAI推理系统与谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后的又一次顶尖国际竞赛中的实力证明。
谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已在GitHub开源。
GitHub地址:
https://github.com/google-deepmind/gemini_icpc2025
ICPC是全球公认的历史最悠久、规模最大、最具声望的大学级算法编程竞赛,每年吸引来自近3000所大学和超过103个国家的参与者,共同解决现实世界的编程问题。
OpenAI与谷歌均参赛并荣获金牌,其中OpenAI推理系统解答了全部12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最佳人类团队答出11道题。
1、OpenAI:满分夺冠,一次性答对11题
OpenAI推理系统荣获满分。
OpenAI表示并未特别为ICPC训练模型,而是采用通用推理模型组合的方式参赛。
比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道难度最高的题目则由这款实验性推理模型解决。
2、谷歌:答对10题,45分钟解出8题
Gemini 2.5 Deep Think高级版本在远程在线环境中按ICPC规则进行比赛,比人类参赛者晚开始10分钟。Gemini共耗时677分钟解决了12题中的10题,其中8题在45分钟内解决,另外两题耗时3小时。
此外,谷歌DeepMind还提到一道困扰所有人类团队的难题被Gemini在半小时内成功解答。
从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI及谷歌的模型在解决高难度数学和推理问题上展现出巨大潜力。ICPC全球执行董事Bill Poucher博士表示,ICPC一直致力于设定问题解决的最高标准,而Gemini在这一领域的成就标志着定义下一代所需AI工具和学术标准的关键时刻。
这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,未来或能与人类专家结合解决更多复杂难题。
本文由主机测评网于2026-04-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260441523.html