当前位置:首页 > 科技资讯 > 正文

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第1张

11月20日,智东西消息显示,OpenAI正式推出了其全新的智能体编程模型GPT-5.1-Codex-Max。该模型基于OpenAI最新推理架构开发,专门针对软件工程、科学研究、数学计算等复杂场景进行深度训练。 

与此同时,OpenAI将GPT-5 Pro升级为GPT-5.1 Pro,据称这一版本在文本创作、数据分析等领域的性能较前代显著提升。不过,OpenAI未透露GPT-5.1 Pro的具体技术细节。 

GPT-5.1-Codex-Max能够在单一任务中连续处理超过百万个token,跨越多重上下文窗口运行。这得益于一项名为压缩(compaction)的创新技术:当模型接近上下文窗口限制时,会自动压缩上下文,保留关键信息,并开启新的上下文窗口,直至任务完成。 

该模型由OpenAI研究科学家Noam Brown主导完成,他在OpenAI专注于测试时计算,即推理技术的研究。 

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第2张

OpenAI认为,持续连贯的工作能力是构建更通用、可靠AI系统的关键基础。GPT-5.1-Codex-Max可以独立运行数小时。在内部评估中,该模型甚至能针对同一任务连续工作24小时,不断迭代实现、修复测试失败,最终交付成功结果。 

在性能方面,GPT-5.1-Codex-Max在多项编程基准测试中表现优于前代GPT-5.1-Codex。该模型还是OpenAI首个专为Windows环境编程操作设计的训练模型。 

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第3张

推理效率上,GPT-5.1-Codex-Max在中等推理强度下完成任务时,所使用的思考token比GPT-5.1-Codex减少约30%,同时保持更高准确性。 

对于延迟不敏感但追求高质量的任务,用户可以开启超高强度推理模式,让模型投入更多时间思考,输出更优解决方案。 

OpenAI预计,这种token效率的提升将为开发者带来实际成本节约。 

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第4张

▲GPT-5.1-Codex-Max用更少token实现更高的准确率

目前,GPT-5.1-Codex-Max已在Codex平台提供,可用于命令行接口、IDE扩展、云端服务和代码审查,API访问功能即将推出。 

OpenAI展示了GPT-5.1-Codex-Max构建的多个网页示例。根据提示词,该模型直接创建了一个完全运行在浏览器中的CartPole(倒立摆)强化学习沙箱环境。 

用户不仅可观察倒立摆的动态模拟,还能通过内置策略梯度控制器直接训练模型,让AI在实验中持续优化策略。 

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第5张

它提供神经网络可视化功能,在训练或推理过程中,用户能实时观察模型权重和激活状态,直观理解决策机制。 

此外,应用界面清晰展示每个回合的步数和奖励,并记录上次存活时间及历史最佳存活时间,使训练过程和成果一目了然。

在实现类似功能前提下,GPT-5.1-Codex-Max仅使用27k token,而GPT-5.1-Codex用量为37k。

GPT-5.1-Codex-Max还开发出太阳系重力模拟器。该应用旨在让用户直接观察天体运动轨迹,通过拖拽、点击与操控界面元素,直观理解轨道、速度与引力之间的关联。

这一网页功能运行流畅,提示词中的要求都得到良好实现。用户可点击画布放置带质量的天体,再次点击即可为测试设置初速度向量,构建任意简易行星系统。

界面提供调节中心天体质量与整体时间缩放因子的滑块,允许用户观察同一轨道结构在不同物理条件下的演化过程。

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第6张

GPT-5.1-Codex-Max构建的下一个案例,帮助用户以直观、动态方式理解光在两种介质界面上的折射规律——斯涅尔定律(Snell’s Law)。

用户可通过左右滑块调节介质1与介质2的折射率。折射率改变时,界面实时更新折射角度,呈现不同光学环境下的光线偏折情况。

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第7张

许多网友分享了使用体验。一位网友尝试让昨日发布的Gemini 3 Pro与GPT-5.1-Codex-Max对决,提示词是创建鹈鹕骑自行车的SVG图像。

结果显示,GPT-5.1-Codex-Max生成的鹈鹕、自行车等元素细节更丰富,逼真度更高。

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第8张

英国定制贺卡公司Moonpig的AI部门负责人Peter Gostev分享,他尝试让GPT-5.1-Codex-Max构建金门大桥模拟器,称这是从类似提示词中获得的最佳效果。

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第9张

与GPT-5.1-Pro相比,Gostev认为GPT-5.1-Codex-Max明显更高效,速度更快。要让GPT-5.1-Pro实现类似效果,需不断指出问题并给出明确要求,而GPT-5.1-Codex-Max更具主动性。

AI工程师Peter Dedene分享,他在体验中发现,GPT-5.1-Codex-Max曾对问题观察5分钟后决定稍后处理,他从未见过Codex有此行为。在他看来,模型似乎展现出初步意识。

OpenAI发布GPT-5.1-Codex-Max:智能体编程模型引领新变革 GPT-5.1-Codex-Max  OpenAI 编程模型 智能体 第10张

但需要注意的是,随着模型能力持续增强,安全性成为关键挑战。OpenAI称GPT-5.1-Codex-Max尚未在内部Preparedness Framework中达到“高等级网络安全能力”,但其安全性能已是行业迄今最强大。

目前,Codex系列模型默认运行在高度隔离的安全沙箱中,文件写入仅限自身工作空间,网络访问被关闭,除非开发者主动启用。这些措施可降低提示词注入等风险。

OpenAI希望通过渐进式部署方法从真实世界收集反馈,并及时更新模型安全防护。

结语:编程模型正迈向“智能体化”新时代

从GPT-5.1-Codex-Max可看出,新一代编程模型不再是简单代码生成器,而是能持续工作、自动调试、主动规划的编程智能体。其长时推理、上下文压缩、自我修复等能力,使模型能独立完成项目级任务。

随着运行成本下降、安全沙箱强化、能力全面增强,未来软件开发方式可能变革,从“编写代码”转向“描述需求+审核结果”,智能体有望承担更多实现与迭代工作。