当前位置:首页 > 科技资讯 > 正文

GPT-5 Pro:编码智能体的性能飞跃与行业影响

GPT-5 Pro在编程领域迅速崛起,成为开发者社区的热议焦点。人工智能专家Karpathy公开发文盛赞,透露Claude Code耗费一小时未能解决的复杂技术难题,GPT-5 Pro仅用十分钟便提供了即用型解决方案,OpenAI首席执行官Sam Altman随即回应表示感谢。

GPT-5 Pro再次获得了人工智能领域权威人士的高度认可。

今日凌晨,Karpathy兴奋地分享道:“必须再次强力推荐OpenAI的GPT-5 Pro,其性能确实卓越超群”!

这背后究竟发生了怎样的故事?

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第1张

在日常工作流程中,Karpathy遇到了一个极具挑战性的编码问题,但Claude Code经过一小时尝试仍无法攻克。

最终,他转向使用GPT-5 Pro,令人惊讶的是,仅仅十分钟后,GPT-5 Pro就直接输出了一个可立即部署的完整解决方案。

更有趣的是,他让Claude模型评估GPT-5 Pro的解法,后者竟撰写了“两段高度评价”的文本,对其表示赞赏。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第2张

最后,Karpathy诚恳地建议:“任何开发者若未将最棘手的编程任务交给GPT-5 Pro处理,无疑是错失了巨大机会”。

在本次编码能力对决中,GPT-5 Pro显著提升了其竞争优势。

Sam Altman迅速向Karpathy致谢,并好奇地问道:“你更希望模型进一步优化智能水平,还是提升运行速度”?

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第3张

OpenAI总裁Greg Brockman借此机会宣传称:“GPT-5 Pro代表了编码工具的下一代革新产品”。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第4张

编码王者之战:GPT-5 Pro确立领先地位

当前,在编程工具领域,每位开发者都有自己偏好的AI模型。

部分人青睐Claude,另一些人选择Gemini,还有开发者更倾向于GPT-5/Codex或Grok Code。

评论区中,一位网友询问Karpathy是否尝试过grok-code-fast-1模型?

他虽未使用,但已将其列入测试计划。每隔数日,Karpathy便会轮换评估现有的各类AI编程工具。

接下来,他详细分享了自己使用OpenAI模型的体验——

坦率地说,大约三周前,我还认为Codex在基础代码编辑和整体用户体验上,不及当前版本的Claude Code。

但仅就GPT-5 Pro而言,它目前确实遥遥领先于其他竞争模型。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第5张

另一位网友评论道:“AI模型能够相互赞赏彼此的工作成果,这才彰显了未来技术的巅峰体验”!

在Karpathy看来,这是一种高效的评估方法,且他经常采用此策略。

让所有模型生成一段内容,然后将所有结果混合,再让每个模型对所有输出进行排名。

最初,人们担心AI会偏向自己的生成结果,但在Karpathy的有限测试中,这一现象并未出现。

这恰似“生成-判别差距”的现实演示——创作优质内容很困难,但识别优秀内容则容易得多,而模型在此方面表现确实出色。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第6张

令人意外的是,这一观点获得了众多网友的共鸣与认同。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第7张

对GPT-5 Pro编码能力给予好评的,并非仅有Karpathy一人。

一位开发者在实际测试后,深切体会到GPT-5 Pro的强大性能。仅用大约六分钟,便一次性完成应用程序开发,并能自由整合图像、文本、箭头等多种元素。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第8张

经过多轮交互,GPT-5 Pro还能生成将SMILES化学表达式转换为ASCII艺术图的代码。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第9张

HubSpot联合创始人同样高度认可GPT-5 Pro的技术实力,但他指出OpenAI Codex的用户体验尚未达到Claude Code的友好程度,不过这一差距正在逐步缩小。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第10张

半月之内:使用量激增十倍

今年五月,OpenAI正式发布了专为软件工程设计的AI编程智能体Codex。

最初,它基于o3架构的codex-1模型提供核心能力。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第11张

自GPT-5发布后,Codex集成了最新模型,性能实现飞跃,吸引了大量开发者的关注与采用。

两天前,Sam Altman官方宣布,过去两周内Codex的使用量增长了约十倍。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第12张

他还透露,内部存在一个高效模型,能够支撑巨大的用户请求量。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第13张

在PR(拉取请求)竞技场中,Codex展现出最强实力,显著超越了Devin、GitHub Copilot和Cursor Agent等工具。

或许你难以想象,无需编写一行代码,即可构建完整应用程序的体验。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第14张

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第15张

一位Claude Code的资深开发者,在深度使用Codex 48小时后,详细对比了二者之间的差异:

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第16张

这位开发者同样认为,Codex在处理Claude遇到的棘手问题时表现优异,且在代码生成方面更为可靠。

GPT-5 Pro:编码智能体的性能飞跃与行业影响 Pro  编码效率 AI模型对比 OpenAI Codex 第17张

不知各位开发者更倾向于选择哪款编码模型?

参考资料

https://x.com/karpathy/status/1964020416139448359

https://x.com/sama/status/1964032346975588371