
Anthropic 公司发布了其旗舰 AI 模型的新版本——Claude Opus 4.1。新模型在编码、推理和智能体任务处理方面都有显著提升。
这次更新基于 Claude Opus 4 构建,目前付费用户已经可以通过 Claude Code、API、亚马逊 Bedrock 和谷歌云 Vertex AI 等多种渠道使用。
更棒的是,服务价格保持不变。
核心亮点速览
1. 硬核的编程能力
最引人注目的一点是,Opus 4.1 在高难度的软件工程基准测试 SWE-Bench 上,取得了 74.5% 的顶尖成绩。
这一表现干净利落地超越了 Gemini 2.5 Pro 和 OpenAI o3,展示了其在代码生成和修复领域的强大技术实力。
2. 肉眼可见的性能飞跃
来自 Windsurf 的评测显示,Opus 4.1 相较于前代 Opus 4,性能提升了整整一个标准差。
要知道,这种幅度的性能飞跃,几乎等同于 Anthropic 自家模型从 Sonnet 3.7 迭代到 Sonnet 4 的巨大跨越。
3. 精准可靠的实战表现
在实际应用中,日本乐天集团发现 Opus 4.1 在处理大型代码库时表现极为出色。
它能精准地找出并修复问题,同时又不会画蛇添足,引入不必要的修改或新的错误。正是这种可靠的精确性,使其成为乐天团队日常代码调试工作的首选。
4. 对开发者极其友好
最后也是对开发者最友好的一点:迁移过程毫无痛点。
开发者要做的,仅仅是把模型名称更新为 claude-opus-4-1-20250805
。
所有现存的开发脚手架都能直接运行,无需任何额外修改,真正做到了无缝切换。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!