近日,Anthropic正式发布了Claude Haiku 4.5版本,现已面向所有用户开放。作为其最小型模型的最新迭代,官方宣称其性能与Sonnet 4相近,成本仅为其三分之一,而速度提升超过两倍。
新版本Haiku将立即在Anthropic的所有免费套餐中上线。该公司认为,这一版本对AI产品的免费层级具有特殊吸引力,因为它既能提供强大功能,又能将服务器负载降至最低。
Anthropic发言人表示,"Haiku 4.5的发布意味着所有用户都能通过Claude.ai免费使用接近前沿水平的智能。同时,它为企业客户带来显著优势:Sonnet 4.5负责前沿规划,Haiku 4.5则为子智能体提供支持,构建多智能体系统,从而快速、高质量地处理复杂重构、迁移及大型功能开发任务。"
"Haiku的表现远超其自身定位。"Anthropic首席产品官Mike Krieger在接受采访时表示。
Haiku 4.5是一款混合推理模型,能够根据处理请求的需求灵活调整计算资源使用量。默认情况下,该模型算法通过一套仅需有限硬件资源的工作流程生成响应。用户可开启"扩展思考"模式,让Haiku 4.5生成更复杂的响应,但这类响应的生成耗时会更长。据该公司介绍,Haiku 4.5能够处理包含多达20万个token信息的多模态提示词,使其可以处理大型文件,如长篇商业文档。该模型每次响应最多可输出6.4万个token。
Anthropic表示,这款模型速度更快,性能甚至优于数月前还被视为行业前沿的其他大型模型。例如,在计算机使用能力上,Claude Haiku 4.5优于该公司5月推出的中型模型Claude Sonnet 4。而在代码生成能力方面,根据测试AI系统软件编码能力的数据集SWE-bench Verified显示,它的表现与Claude Sonnet 4以及OpenAI最新模型GPT-5相近。
并且,Anthropic引用了一系列新的基准测试结果来支撑这些性能说法。在该公司的测试中,Haiku在SWE-Bench验证基准测试中得分为73%,在以命令行为核心的Terminal-Bench基准测试中得分为41%。这一成绩低于Sonnet 4.5,但在两项测试中均与Sonnet 4、GPT-5以及Gemini 2.5持平。
测试显示,在工具使用、计算机使用和视觉推理类基准测试中,Haiku也取得了相近结果。在OSWorld基准测试中,Haiku 4.5得分达50.7%,显著超过Sonnet 4的42.2%。其在模拟人类计算机操作方面的出色能力,为自动化领域开辟了新可能。借助Python工具支持时,该模型数学任务得分达96.3%;即便不使用工具,也保持着80.7%的优异表现。在以终端为核心的编码任务中,Haiku 4.5得分41.0%,同样优于Sonnet 4的36.4%。
此外,Anthropic对Haiku 4.5开展了一系列详细的安全性与对齐性评估。该模型的风险行为发生率较低,且对齐表现显著优于其前代产品Haiku 3.5。在自动对齐评估中,Haiku 4.5的总体未对齐行为率在统计上也显著低于Sonnet 4.5和Opus 4.1。该公司称,"以这一指标衡量,Claude Haiku 4.5成为了我们目前最安全的模型。"
现在,Haiku 4.5已在全平台上线。作为开发者,只需在Claude API中调用claude-haiku-4-5即可使用。其定价为每百万输入tokens 1美元,每百万输出tokens 5美元。相比之下,Sonnet 4.5的价格是其三倍,定价为每百万输入tokens 3美元、每百万输出tokens 15美元;而Opus 4.1的定价更高,为每百万输入tokens 15美元、每百万输出tokens 75美元。
值得一提的是,有用户测试后反馈,"‘两倍多速度’其实还是低估Haiku了,说实话。我搭建了一个能直接对比Sonnet和Haiku 4.5的方法,发现Haiku 4.5速度大概是前者的3.5倍。而且用户体验感要好得多,因为Haiku能始终保持在‘流畅响应区间’内。"
Haiku 4.5的发布,延续了Anthropic近期一系列备受关注的产品发布节奏:两周前,该公司刚推出Sonnet 4.5;两个月前,推出了Opus 4.1。这两款产品在发布时均被赞誉为"行业领先水平"。而Haiku的上一个版本发布于2024年10月。
该公司表示,Sonnet 4.5仍是Anthropic性能最强的模型,而Haiku 4.5则为用户提供了新选择:当用户希望获得接近前沿的性能,同时又追求更高成本效益时,它便是理想之选。"即便对我个人使用而言,尽管它不如Sonnet智能,但我在Claude上已开始默认使用它,尤其是在移动应用端——因为它能快得多地给出答案。" Krieger说道。
此外,该模型的轻量级特性意味着,更易于并行部署多个Haiku智能体,或与更复杂的模型搭配使用。
例如,在多模型协同使用方面,Sonnet 4.5可将复杂问题拆解为多步骤计划,随后协调多个Haiku 4.5模型组成"团队",并行完成各项子任务。Krieger指出,让这两款模型协同工作,对希望借助AI处理长期项目的企业而言尤为实用。"企业可让Haiku监控金融数据流——由于它体型更小、成本更低、速度更快,能处理更大体量的数据——随后将初步洞察结果移交Sonnet,由后者进行更深入的分析。" 他解释道。
Informa TechTarget旗下子公司Omdia的分析师Lian Jye Su表示,Anthropic设计Haiku的初衷显然就是为了辅助Sonnet,"这样能带来高得多的成本效益比"。他补充称,若用户选择通过大型模型Sonnet运行AI项目,会导致token消耗量大幅增加,成本也随之升高;相比之下,将任务分配给Haiku这类小型模型,性价比会更高。使用AI技术的企业应从一开始就明白,AI工作流十分复杂,需做好准备,通过混合使用大型与小型模型来提升成本效益。
Futurum Group分析师David Nicholson则对于Sonnet 4.5与Haiku 4.5之间"分工协作"的能力提出了一些疑问:"它们如何拆分任务,又如何确保原始目标的完整性不受影响?每个Haiku实例都会生成独特的数据,执行子任务的所有Haiku实例,是否能知晓其他实例的工作内容?将一项任务拆分为子任务的效率,又存在哪些局限?"
Krieger表示,Haiku将首次让全新的生产环境部署模式成为可能。"它为生产环境中的AI开辟了全新应用领域——Sonnet负责复杂规划,而由Haiku驱动的子智能体则快速执行任务,我们为用户提供了一套完整的智能体工具库,其中每个模型都针对任务的不同环节,具备了智能、速度与成本的最优组合。"
Haiku 4.5最直接的应用场景还可能出现在软件开发工具领域。Claude Code已在该领域广泛使用,而延迟往往是该领域的关键影响因素。在Anthropic提供的声明中,Zencoder首席执行官Andrew Filev将Haiku新版本描述为"解锁了一整套全新应用场景"。
目前,已有多家企业接入Haiku 4.5并反馈了积极效果。代码初创公司Augment的联合创始人Guy Gur-Ari表示,该模型"达到了我们此前认为不可能的平衡点:接近前沿水平的代码生成质量,兼具极快的速度与成本效益"。在Augment的内部测试中,Haiku 4.5实现了Sonnet 4.5 90%的性能,同时表现与规模大得多的模型相当。
另一家聚焦代码领域的初创公司Windsurf首席执行官Jeff Wang称,Haiku 4.5"模糊了"速度、成本与质量之间传统权衡的界限。"它是一款兼具速度与前沿性能的模型,同时保持了成本效率,也预示了这类模型的发展方向。"演示软件公司Gamma的联合创始人Jon Noronha表示,Haiku 4.5"在幻灯片文本生成的指令遵循能力上,表现优于我们当前使用的模型:准确率达65%,而我们付费层级模型的准确率为44%。这对我们的单位经济效益而言,是颠覆性的改变"。
此次模型发布之际,Anthropic的业务正呈爆发式增长。据该公司发言人称,其月度年化收入即将突破70亿美元,而8月公布的这一数据还仅为50多亿美元。路透社获取的内部预测显示,Anthropic设定的2026年年化收入目标为200亿至260亿美元,较当前水平增幅将超过200%,接近300%。
目前,Anthropic服务的企业客户已超30万家,企业级产品收入约占总营收的80%。在其旗下最成功的产品中,代码生成工具Claude Code表现尤为突出——自今年早些时候推出以来,该工具的年化收入已接近10亿美元。
"我们现在确实是火力全开。" Krieger表示。据了解,行业的极速发展,让Anthropic在每次产品发布后都没有太多时间安于现状。该公司在训练Sonnet 4.5的同时,就已启动了Haiku 4.5的研发工作。
Krieger将过去两年描述为"AI错失恐惧期",期间企业纷纷采用AI工具,却缺乏清晰的成功衡量标准;而如今,企业开始要求获得可量化的投资回报。在"Superhuman AI"播客节目中,他表示:"优秀的产品必须有某种成功指标或评估标准作为支撑。在与部署AI的企业交流时,我多次发现了这一点。"对于评估AI工具的企业而言,其考量越来越聚焦于具体的生产力提升。
五个月前,Sonnet 4的能力还需高价获取,且代表行业前沿;如今,Haiku 4.5能以三分之一的成本提供相近性能。短短五个月内,AI性能保持稳定,价格降了原先的三分之二。若这一趋势持续(从Anthropic的发布节奏,以及来自OpenAI、谷歌的竞争压力来看,这种可能性很大),那么如今看似先进的AI能力,一年内可能会变得常规且廉价。AI的基本经济逻辑正以惊人速度发生转变。
当前,Anthropic估值达1830亿美元。Anthropic正紧追谷歌、OpenAI等竞争对手——其中OpenAI的估值已飙升至5000亿美元。自今年8月推出GPT-5后,OpenAI已签署多项数十亿美元规模的基础设施协议,并发布了名为Sora的短视频应用。
但Jye Su认为,"如今所有模型都处于迭代优化中,遗憾的是,即便在所有头部厂商的产品之间,也没有哪项特性真正脱颖而出。"
企业最终会选择Claude,还是OpenAI、谷歌及其他不断涌现的竞争对手提供的、能力日益强大的产品,目前仍是未知数。但Anthropic正明确押注:AI的未来不属于那些能打造出单一最强模型的企业,而属于那些能以合适的价格、合适的速度提供合适智能,并让所有人都能获取的企业。
参考链接:
https://www.anthropic.com/news/claude-haiku-4-5
https://techcrunch.com/2025/10/15/anthropic-launches-new-version-of-scaled-down-haiku-model/
https://aibusiness.com/generative-ai/anthropic-launches-claude-haiku-4-5-a-small-model-#close-modal
https://venturebeat.com/ai/anthropic-is-giving-away-its-powerful-claude-haiku-4-5-ai-for-free-to-take
本文由主机测评网于2026-01-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260116293.html