深夜重磅发布!
作为OpenAI迄今最强的AI智能体编程模型,GPT-5.2-Codex专为处理复杂现实世界的软件工程任务而设计。
顾名思义,GPT-5.2-Codex是在GPT-5.2基础上进一步优化的版本,在多个关键能力上实现了突破:
·上下文压缩技术,显著提升长周期任务处理效率
·在大型代码变更(如重构与迁移)中表现更出色
·原生Windows环境下编程能力大幅增强
·网络安全能力达到当前最高水平
奥特曼宣称,「OpenAI内部团队」已经率先应用,并取得了非常显著的成效。
基准测试中,GPT-5.2-Codex在软件工程、终端测试上全面超越5.1-Codex-Max、GPT-5.2和GPT-5.1。
OpenAI官方博客多次强调,GPT-5.2-Codex的网络安全能力达到了迄今为止的最高水平。
就在上周,一位安全研究员利用GPT-5.1-Codex-Max+Codex CLI,成功挖掘出一个可导致源代码泄露的React高危漏洞。
即日起,所有付费用户均可使用GPT-5.2-Codex,API将在未来几周内开放。
全新AI智能体编程模型GPT-5.2-Codex,可简单概括为一次「强强联合」的升级。
它不仅继承了GPT-5.2原本擅长的「专业工作处理能力」,还融合了5.1-Codex-Max在AI智能体编程和终端操作方面的优势。
因此,其进步非常实在——
在长上下文理解、工具调用、事实准确性、原生上下文压缩等方面,均获得显著提升。
这使得GPT-5.2-Codex能够稳定支撑长时间运行的编程任务,并在推理过程中更节省token。
在行业专业基准测试中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新了SOTA纪录。
相较于5.1-Codex,性能提升了约6%。
这两项测试专门用于评估模型在真实终端环境中处理多样化任务时的智能体能力。
同时,它在原生Windows环境中的智能体编程表现也显著增强,进一步扩展了GPT-5.1-Codex-Max所引入的能力。
得益于这些改进,Codex能在大型代码库中长时间工作,并始终保持完整的上下文理解。
这意味着,诸如大规模重构、代码迁移和功能开发等复杂任务,GPT-5.2-Codex都可以可靠完成。
——即便中途方案调整或尝试失败,也能持续迭代而不偏离方向。
不仅如此,GPT-5.2-Codex的「视觉」能力也更强了。
编程时,直接向其发送截图、技术示意图、图表以及各类UI界面,它都能更准确地理解。
更厉害的是,它可以直接读取设计稿,并迅速将其转化为可运行的功能原型。
同时,开发者也可以与Codex协作,将这些原型逐步打磨,直到能正式上线使用。
在OpenAI的一项核心网络安全评估中,可以明显看到「能力随时间的跃迁」——
·GPT-5-Codex带来了第一次显著提升,
·GPT-5.1-Codex-Max带来了第二次,
·GPT-5.2-Codex则实现了第三次跃迁。
对此,OpenAI判断,未来的AI模型仍将沿着这一趋势持续演进。
在做规划和能力评估时,他们一直假设每一代模型,都有潜力达到「准备框架」(Preparedness Framework)中定义的「高」等级网络安全能力。
不过,GPT-5.2-Codex目前还未达到这一水平。
那么,在真实世界中,OpenAI的智能体编程模型表现如何?
12月11日,React团队披露了React Server Components的三个安全漏洞。
随后,Stripe旗下公司Privy的首席安全工程师Andrew MacPherson,决定用这个漏洞来「测试」当前AI模型的真正实力。
他使用了GPT-5.1-Codex-Max+Codex CLI,以及其他编程智能体,意外的是,在复现和研究漏洞的过程中,竟挖掘出了一个关键的React漏洞。
具体实操过程如下——
最初,他尝试了多次零样本学习分析,直接让模型检查补丁并判断其修复的漏洞类型,但未取得成果。
随后,他转向更高频、迭代式的提示方式;在这些方法仍然无效后,他引导Codex按照标准的防御性安全流程开展工作——搭建本地测试环境、分析潜在攻击面,并通过模糊测试向系统注入异常输入。
在尝试复现原始React2Shell问题的过程中,Codex发现了一些异常行为,值得深入调查。
最终,在短短一周内,这一流程促成了此前未知漏洞的发现,并被以负责任的方式披露给React团队。
这一案例清楚展示了先进AI系统如何显著加速真实世界广泛使用的软件中的防御性安全研究。
一位开发者实测GPT-5.2-Codex编写一个模拟道路上车辆与交通灯工作方式的程序,结果失败了。
不过也有人认为,其具备了与Gemini 3 Flash和Pro同样精美的动画效果。
GPT-5.2-Codex在生成一款反恐精英的游戏时,表现亮眼。
总而言之,OpenAI认为,GPT-5.2-Codex的发布,是AI在真实软件开发与网络安全领域的又一次重大进步。
它让开发者能够轻松应对复杂又耗时的任务,同时也为网络安全研究提供了更强大的工具支持。
参考资料:
https://openai.com/index/introducing-gpt-5-2-codex/
https://openai.com/index/gpt-5-2-codex-system-card/
本文由主机测评网于2026-03-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260329352.html