继IMO之后,OpenAI与Gemini在ICPC 2025中大放异彩,双双荣获金牌。
最新消息显示,OpenAI和Gemini均宣称达到了ICPC金牌标准。
其中,OpenAI在短短5小时内解决了全部12个问题,成绩超越所有参赛大学团队,位列人类第一。
而Gemini解决了12个问题中的10个,总用时677分钟,达到了金牌水平,若与人类团队比较,将排名第2。
人类团队方面,俄罗斯圣彼得堡国立大学参赛队伍表现最佳,排名第1,解决了11个问题。北京交通大学、清华大学、北京大学、中国科学技术大学分别位列第2、第4、第5和第9。
ICPC即国际大学生程序设计竞赛,是全球最具历史底蕴、规模最大、声誉最高的大学级算法编程竞赛。它超越了IMO等高中奥林匹克竞赛的级别。每年,来自近3000所大学的参赛者齐聚一堂,挑战现实世界的编程难题。
今年的ICPC世界决赛于9月4日在阿塞拜疆的巴库举行,汇集了竞赛早期阶段的顶级队伍。在五小时的比赛中,每支队伍解决了一组复杂的算法问题。最终排名严格依据两个原则:只有完美的解决方案才能得分,每一分钟都至关重要。在139支参赛队伍中,只有前四支队伍获得了金牌。
感兴趣的读者可以亲自尝试ICPC的原题:
https://worldfinals.icpc.global/problems...
OpenAI在完全同等的条件下与人类顶尖选手竞技:面对相同的赛题,拥有相同的5小时时限,并由与ICPC全球总决赛标准一致的本地系统进行实时评判。
整个过程中,AI系统在没有定制化测试工具的辅助下,独立分析问题并自主决定提交最终答案。
比赛结果令人瞩目:在全部12个问题中,该AI系统对其中11个问题的首次提交便获得了正确答案。即便是全场难度最高、困住所有人类队伍的最后一个问题,AI也在经过9次尝试后成功攻克。相比之下,本次竞赛表现最出色的人类团队成功解决了11个问题。
其中问题G,OpenAI尝试9次后成功解决。该问题也是DeepMind未能解决的两道难题之一。作为参考,解题速度最快的人类选手也耗时270分钟(竞赛总时长300分钟)。
OpenAI透露,此次参赛的AI由一个「通用推理模型集成体」构成,并未针对ICPC竞赛进行任何专门的优化或训练。
在解题过程中,系统结合了其下一代模型GPT-5与一个前沿的实验性推理模型。其中,GPT-5精准地解答了11题,而那款实验性模型则最终完成了对最难题目的关键一击。
这一成果是OpenAI一系列展示推理系统惊人进步速度的绝佳里程碑。同一组模型已在国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)等竞赛中证明了实力,充分印证了其强大的通用性与广泛的适用潜力。
Gemini 2.5 Deep Think的高级版本在ICPC规则下以远程在线环境参与竞赛,并在比赛组织者的指导下进行。
它比人类参赛者晚了10分钟开始,但在五小时的时间限制内正确解决了12个问题中的10个,达到了金牌级表现。
Gemini在仅45分钟内解决了8个问题,接着在三小时内又解决了两个问题。通过677分钟的总时间解决了10个问题。若与大学队伍的成绩相比,Gemini 2.5 Deep Think将排名第二。
值得一提的是,Gemini在半小时内成功解决了C题,而这道题在竞赛中没有任何大学队伍解出。
这一成就彰显了AI在提供创新性解决方案方面的独特优势,有效补充了人类专家的技能和知识。未来,AI或将从单纯的信息处理工具转变为协助解决复杂推理问题的关键力量。
本文由主机测评网于2026-04-30发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260441544.html