Anthropic 于 2026 年 4 月 16 日星期四正式发布了其最新的人工智能模型 Claude Opus 4.7。
Anthropic 推出 Claude Opus 4.7,代理式工作流成为焦点

要点:
- Anthropic于2026年4月16日发布了Claude Opus 4.7,该模型在SWE-bench Verified测试中取得了87.6%的得分。
- 随着人工智能行业向代理自主性转型,Opus 4.7在复杂编程和金融领域表现优于GPT-5.4。
- 由于新模型的令牌消耗量是前一版本 4.6 的 1.0 至 1.35 倍,开发者必须妥善管理成本。
AI 进化:Claude Opus 4.7 发布,视觉与记忆能力全面增强
这家总部位于旧金山的AI初创公司将此次发布定位为迄今为止功能最强大的公开可用模型。这是对仅在两个月前(2月)发布的Opus 4.6版本的一次针对性升级。
虽然受限的Claude Mythos预览版仍处于网络安全领域的有限测试阶段,但Opus 4.7专为更广泛的市场打造。它特别专注于软件工程、长期任务以及复杂的财务分析。
Anthropic 发布的性能指标显示,该模型在自动化工作流方面取得了显著进步。在 SWE-bench Verified 编码基准测试中,新模型的准确率达到 87.6%,高于 4.6 版本的 80.8%。

该模型还在多个关键类别中成功超越了主要竞争对手。Anthropic报告称,在工具使用和计算机交互测试中,Opus 4.7的表现优于OpenAI的GPT-5.4和谷歌的Gemini 3.1 Pro。
最显著的改进之一是模型视觉能力的重大升级。Claude Opus 4.7 现可处理长边最大达 2,576 像素的图像,是此前分辨率限制的三倍。
这一视觉能力的提升使该AI能够更好地解读复杂的图表、用户界面和技术示意图。不过,该公司指出,高分辨率图像会消耗更多令牌,这可能会增加高使用量用户的成本。 Anthropic还在其Claude Code环境中推出了一项名为/ultrareview的新功能。该工具允许专业版和最高级别的用户运行多代理会话,以识别软件中的错误和设计缺陷。
对于金融专业人士而言,该模型在经济建模方面展现出更高的严谨性。其在通用金融模块上获得了0.813的评分,较上一版本0.767的评分实现了显著提升。
该模型的定价结构保持不变,输入令牌每百万计费 5 美元,输出令牌每百万计费 25 美元。为帮助管理长时间自主运行期间的费用,Anthropic 已将任务预算功能纳入公开测试版。
一丝不苟地执行指令
开发者社区的早期反馈表明,该模型在遵循指令方面更加字面化。这一变化可能要求用户重新调整那些针对Claude家族旧版本优化的现有提示词。 “Claude 4.7已发布,使用它感觉就像坐进了一辆F1赛车。动力远超以往,而且它会全速精准执行你的指令。 你的任务就是选定方向并完成转向,”一位用户在 X 上写道。 部分测试者观察到,更新后的令牌化器在处理相同输入时,使用的令牌数量最多可达 1.35 倍。虽然这可能导致配额更快耗尽,但该公司认为,其每项任务的性能表现足以证明这种资源使用是合理的。

Crossmint的Lobster.cash整合万事达卡Agent Pay,助力代理商电商业务
Lobster.cash 集成了 Mastercard Agent Pay 服务,因此 Openclaw AI 代理可以使用持卡人现有的银行卡进行交易,同时受发卡机构的管控。 read more.
立即阅读
Crossmint的Lobster.cash整合万事达卡Agent Pay,助力代理商电商业务
Lobster.cash 集成了 Mastercard Agent Pay 服务,因此 Openclaw AI 代理可以使用持卡人现有的银行卡进行交易,同时受发卡机构的管控。 read more.
立即阅读
Crossmint的Lobster.cash整合万事达卡Agent Pay,助力代理商电商业务
立即阅读Lobster.cash 集成了 Mastercard Agent Pay 服务,因此 Openclaw AI 代理可以使用持卡人现有的银行卡进行交易,同时受发卡机构的管控。 read more.
安全性依旧是核心关注点,该模型新增了自动防护机制,用于阻止高风险的网络安全用途。Anthropic的系统简介强调了模型诚实度的提升,以及对生成有害内容的更强抵抗力。 该模型现已通过Claude API、Amazon Bedrock、Google Vertex AI和Microsoft Foundry提供。它保留了今年早些时候引入的100万令牌上下文窗口。













