当前位置：首页 > 科技资讯 > 正文

Anthropic发布Claude Sonnet 4.5：智能编码与复杂软件构建新纪元

主机测评网
科技资讯
2026-05-02
686

聚焦亮点：

Anthropic最新推出Claude Sonnet 4.5，宣称其为全球顶尖、最安全的编码及复杂软件智能体建模工具。
Claude Sonnet 4.5可自主编码长达30小时，性能远超其前代Claude 4 Opus的7小时。
新增的checkpoints功能让编码工具Claude Code在每次代码更改前自动保存状态，便于开发者快速回溯至先前版本。

Anthropic发布Claude Sonnet 4.5：智能编码与复杂软件构建新纪元 Anthropic Claude 4.5 智能编码安全模型第1张

9月29日，人工智能公司Anthropic正式发布了新一代AI模型——Claude Sonnet 4.5，宣称其为全球顶尖、最安全的编码及复杂软件智能体建模工具。

该模型在长周期任务处理方面取得了显著进步，能够独立运行30小时，完成从开发到安全审计的全流程工作，并在SWE-bench Verified等权威测试中取得了最优成绩。同时，Anthropic还升级了开发者生态系统，推出了Claude Agent SDK等工具，并为Max订阅用户开放了“用Claude想象”临时预览功能，支持实时生成软件演示。

Claude Sonnet 4.5的定价延续了前代标准，每百万输入Tokens为3美元，每百万输出Tokens为15美元，开发者无需额外成本即可升级。

当前AI编码领域的竞争已经进入白热化阶段，Anthropic面临着来自OpenAI的GPT-5-Codex和谷歌Gemini等多强并立的竞争态势。Anthropic在今年8月刚推出Claude Opus 4.1，在5月推出Claude Sonnet 4，如此快速的迭代节奏，既体现了当前AI领域的激烈竞争，也预示着没有企业能长期占据绝对领先地位，技术迭代与创新将成为行业持续发展的核心驱动力。

01.30小时自主开发成新亮点

Anthropic发布Claude Sonnet 4.5：智能编码与复杂软件构建新纪元 Anthropic Claude 4.5 智能编码安全模型第2张

Anthropic表示，Claude Sonnet 4.5在多项指标上超越了OpenAI的GPT-5和谷歌的Gemini等主要竞争对手。在SWE-bench Verified基准测试中，其得分高达82.0%，该测试用于评估AI解决GitHub仓库中真实世界软件工程问题的能力。相比之下，Claude Opus 4.1的得分为79.4%，Claude Sonnet 4的得分为80.2%，GPT-5的得分为72.8%，Gemini 2.5 Pro的得分为67.2%。

此外，该模型在OSWorld测试中创造了新纪录，得分达到61.4%。与四个月前发布的Sonnet 4相比，其得分从42.2%大幅提升。

此次升级的性能提升不仅体现在分数上，更在于模型自主工作耐力方面。Anthropic研究员大卫・赫尔希（David Hershey）在接受TechCrunch采访时表示，在与企业客户的早期试用中，Claude Sonnet 4.5能够自主编码长达30小时，编写了一款类似Slack或Teams的聊天应用，共生成约1.1万行代码，直至任务完成才停止运行。这远超其前代Claude 4 Opus约7小时的能力。

赫尔希观察到，该模型不仅能自主构建应用程序，还能自行搭建数据库服务、购买域名，甚至完成SOC 2安全审计。这标志着其能力已从孤立的编码任务扩展至全周期的项目执行，展现出前所未有的实用长周期智能体能力。

02.多工具解决开发痛点，Agent SDK助力定制智能体

Anthropic发布Claude Sonnet 4.5：智能编码与复杂软件构建新纪元 Anthropic Claude 4.5 智能编码安全模型第3张

随着Claude Sonnet 4.5的发布，Anthropic对开发者生态系统进行了重大扩展，推出了一系列工具以解决核心开发需求。

编码工具Claude Code新增了checkpoints功能，可以自动保存代码更改状态供即时回溯。同时，还推出了测试阶段的原生VS Code扩展，将能力无缝集成至IDE，提供直观图形化体验。针对长周期智能体的上下文限制，Anthropic引入了“上下文编辑”和“记忆工具”，前者可清除过时内容，后者能跨会话存储关键信息。二者结合使智能体复杂任务性能提升39%，Tokens消耗减少84%。

面向高级用户的Claude Agent SDK开放了Claude Code核心基础设施权限，支持开发者构建金融合规、网络安全等领域的定制智能体。Anthropic还开放了虚拟机访问权限并提供内存管理、多智能体支持等功能，相当于打包核心技术模块供开发者打造专属前沿智能体。

03.Claude Sonnet 4.5 抗攻击能力升级，降低不良行为发生率

Anthropic强调，Claude Sonnet 4.5是其“迄今为止最对齐的前沿模型”。该公司在新闻稿中详细介绍了广泛的安全训练，显著降低了谄媚、欺骗和寻求权力等不良行为的发生率。Claude Sonnet 4.5在严格的ASL-3（人工智能安全等级 3）框架下发布，部署了过滤器以检测并防止生成潜在危险输出，特别是在化学、生物、放射和核（CBRN）武器相关内容方面。

卡普兰表示：“我认为这是我们在一两年内看到的最大安全飞跃。”这一对安全的坚定承诺是对行业普遍关切的直接回应，旨在与企业客户建立信任。Anthropic表示，Claude Sonnet 4.5在抵御提示注入攻击及其他前代模型常见漏洞方面表现更佳。