
Claude Haiku 4.5 证明:快速、智能、实惠终于可以兼得。
Anthropic 刚刚做了一件出人意料的事: 他们发布了一款并不昂贵的新模型。
在其小型模型系列沉寂了一年多之后,Haiku 4.5 问世了,它直接跳过了 3.5 到 4.5 之间的所有版本号,实现了一次巨大的飞跃。
这是自 2024 年 3 月以来,Anthropic 对其紧凑型模型的首次真正更新,它展示了整个行业格局的巨大变迁。
Haiku 4.5 并非一个功能简化的玩具。
它速度快、能力强,并为真实世界的使用场景进行了调优,专为那些既关心延迟也关心智能的开发者而打造。
其输入成本为每百万 token 1 美元,输出成本为每百万 token 5 美元,这个价格仅为 Sonnet 4.5 的一小部分,但它提供的编码性能几乎相当,运行速度更是其两倍。
多年来第一次,小型不再意味着功能有限。
它意味着高效。
而这将彻底改变我们利用 AI 进行构建的方式。
当 Anthropic 在 2025 年 5 月推出 Sonnet 4 时,它是其在编码领域的旗舰产品。
五个月后,Haiku 4.5 达到了相同的基准测试等级,但价格仅为三分之一,速度却快了两倍以上。
根据 Anthropic 官方的 SWE-bench 验证得分(73.3%),Haiku 4.5 在某些任务上甚至超过了 Sonnet 4,例如在 Claude Code 内部进行计算机使用和多智能体编码。
规格说明了一切:

正如 Anthropic 指出的那样:
最近还处于前沿的技术,现在变得更便宜、更快速了。五个月前,Claude Sonnet 4 代表着顶尖水平。而今天,Haiku 4.5 以三分之一的成本和超过两倍的速度,提供了与之相当的编码性能。
这就是智能领域的结构性通缩,它正在改变我们所构建的一切事物的经济学。
为什么这是一个颠覆性的改变?
1. 将速度作为战略
Haiku 4.5 每秒能生成 150 个 token,这不仅比 GPT-5(每秒 20 token)更快,而且快到足以让人感觉是实时的。
对于实时编码助手、客服代理和多智能体编排等应用,这种速度消除了几个月来一直扼杀用户体验的摩擦感。
2. 在小型模型中实现推理能力
这是第一款具备扩展思考模式的 Haiku 模型。但其天才之处在于:
Anthropic 训练它使其能明确具备上下文感知能力。它知道自己已经使用了多少上下文窗口,并学会了据此来决定是结束任务还是继续推进。
引自其系统卡片:
我们发现,这种干预措施能有效限制智能体的懒惰现象,即模型过早地停止处理问题、给出不完整的答案或在任务上偷工减料。
这不仅仅是一个功能。这是在解决智能体 AI 的核心问题之一。
3. 可扩展的安全性
Haiku 4.5 表现出比 Sonnet 4.5 和 Opus 4.1 都更低的失准率,使其成为 Anthropic 迄今为止最对齐的模型。
对于处理敏感数据或受监管工作流的生产系统来说,这一点至关重要。
基准测试:Haiku 4.5 的主导领域
综合性能

数据清晰地表明:Haiku 4.5 在大多数基准测试中持平或超越了 Sonnet 4 —— 一个仅在五个月前还处于前沿水平的模型。
开发性能:为生产环境而生
对开发者而言,真正重要的不只是学术基准测试,而是真实世界中的编码性能。这正是 Haiku 4.5 真正大放异彩的地方:


真实世界成本与速度分析
在这里,其经济效益变得不容忽视:

这对 Humiris 意味着什么
在 Humiris,我们始终坚信 AI 的未来并非依赖于某个单一的、庞大的模型。
而是关于由多个专业化 AI 组成的混合模型,它们像一个协调一致的团队一样协同工作。
到目前为止,这种架构的主要瓶颈不是智能,而是成本和速度。
前沿模型过于庞大,难以并行运行;而廉价模型又不够智能,无法跟上节奏。
Haiku 4.5 改变了这一局面。
它速度够快,可以衍生出数十个并发的智能体;它也足够智能,能够处理每个任务中细致入微的推理。
Anthropic 的这次新发布不仅仅是又一款新模型,它是一次针对AI 原生开发的架构性解锁。
它验证了我们一直以来努力的方向:在一个混合模型生态系统下,让快速、可组合、具备推理能力的模型并行工作。
这使得我们第一次能够像构建软件那样——以模块化、迭代式、多智能体的方式——来构建 AI 产品,这不仅成为可能,而且在实践和经济上都变得可行。
如果说 Haiku 4.5 是 AI 基础设施中缺失的那一块拼图,那么 Codiris 就是让这股力量变得可见的地方。
它是第一个由产品构建者为产品构建者打造的产品开发环境。
使用 Codiris 的团队通常能达到传统团队 10 倍的生产力。
作者:HUMIRIS AI
一键三连「