北京时间今日凌晨,Anthropic正式揭晓了Claude Sonnet 4.5的发布。
这一版本被Claude视为全球顶尖的编码模型,在智能体构建、计算机运用、推理及数学能力上取得了显著突破。
代码无处不在,它驱动着应用程序、表格和各类工具。
现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。
随着Sonnet 4.5的发布,Anthropic对Claude全线产品进行了大规模更新:
Claude Code新增了备受期待的「检查点」(Checkpoints)功能,可实时保存进度并一键回滚;同时更新了终端界面,并推出了原生VS Code插件。
Claude API增加了上下文编辑功能和记忆工具,使智能体能运行更长时间,处理更复杂的任务。
Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。
Claude for Chrome扩展对之前等待名单中的Max用户开放。
此外,开发者社区迎来了新的核心资源:Claude Agent SDK。
这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。
Sonnet 4.5在多项权威测试中表现出色:
SWE-bench Verified:在真实软件编码能力测试中达到最新最优水平,可在复杂的多步骤任务中持续执行超过30小时。
OSWorld:在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4的成绩为42.2%。
视频展示了Claude for Chrome的模拟操作计算机任务能力。
推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。
这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:
Claude Code能自主编程超过3… " alt="专业用户评价"/>
本文由主机测评网于2026-05-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260542177.html