当前位置：首页 > 科技资讯 > 正文

AI大战升级：OpenAI与Anthropic的顶级更新

就在刚刚，硅谷 AI 圈迎来了一场「火星撞地球」的较量。

OpenAI 和 Anthropic 几乎同时发布了他们的重磅更新：Claude Opus 4.6 和 GPT-5.3-Codex。这场竞赛无疑让 AI 社区沸腾了。

在昨晚之前，我们还在讨论如何写好 Prompt 辅助工作；而今天之后，我们或许需要学习如何以老板的身份管理 AI 员工。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第1张

AI 创造 AI，或将接管你的电脑

昨天，Sam Altman 在 X 平台上还凡尔赛了一把 Codex 的「百万活跃用户」里程碑。仅仅一天后，OpenAI 再次出击，扔出了王炸——

GPT-5.3-Codex。

技术文档中有一句极具分量的话：「这是我们第一个在创造自己的过程中发挥关键作用的模型。」

换句话说，AI 已经学会了自己写代码、找 Bug，甚至开始训练下一代 AI 了。这种自我进化能力也体现在了跑分数据上。

记得那个模拟人类操作电脑的 OSWorld-Verified 基准测试吗？前代模型的准确率只有 38.2%，但这次，GPT-5.3-Codex 直接涨到了 64.7%。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第2张

要知道，人类的平均水平也就 72%。这意味着，AI 距离像你一样熟练地操作电脑，只差一层窗户纸了。

而在 Terminal-Bench 2.0（命令行操作基准测试）中，它更是拿下了 77.3% 的高分，把 GPT-5.2（62.2%）远远甩在身后。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第3张

在覆盖四种编程语言、抗污染且全是真实世界工程难题的 SWE-Bench Pro 基准测试中，GPT-5.3-Codex 也表现出 SOTA 水准，而且用的 Token 比以往任何模型都少。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第4张

OpenAI 甚至展示了它独立构建的能力：

在几天内，它从零构建了一款包含多张地图的赛车游戏 v2，还搞定了一款管理氧气系统的深海潜水游戏。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第5张

最让我印象深刻的是 GPT-5.3-Codex 对模糊意图的理解。

在构建落地页时，它自动把年度计划换算成了打折后的月付价格，还自动补充了用户评价轮播——这一切，你甚至不需要下指令。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第6张

OpenAI 的野心已经显露无遗：从微软的 AI 副驾驶（Copilot），到掌控方向盘甚至能自己修车的司机。

值得一提的是，此前有传 OpenAI 对英伟达 AI 芯片不满，但这次官方博客特意强调：GPT-5.3-Codex 的设计、训练和部署都在 NVIDIA GB200 NVL72 系统上完成。

AI大战升级：OpenAI与Anthropic的顶级更新 OpenAI Anthropic GPT-5.3-Codex Claude Opus 4.6 第7张

Claude Opus 4.6：告别「金鱼记忆」的绝地反击

在 GPT-5.3-Codex 发布前后，Anthropic 也端出了他们的春节大礼包。

虽然 Claude「中杯」Sonnet 模型没有更新，但 Anthropic 端出了「超大杯」—— Claude Opus 4.6。

本文由主机测评网于2026-07-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://vpshk.cn/20260748373.html