技术支持
News

Anthropic 推出 Claude Opus 4.7,代理式工作流成为焦点

Anthropic 于 2026 年 4 月 16 日星期四正式发布了其最新的人工智能模型 Claude Opus 4.7。

分享
Anthropic 推出 Claude Opus 4.7,代理式工作流成为焦点

要点:

  • Anthropic于2026年4月16日发布了Claude Opus 4.7,该模型在SWE-bench Verified测试中取得了87.6%的得分。
  • 随着人工智能行业向代理自主性转型,Opus 4.7在复杂编程和金融领域表现优于GPT-5.4。
  • 由于新模型的令牌消耗量是前一版本 4.6 的 1.0 至 1.35 倍,开发者必须妥善管理成本。

AI 进化:Claude Opus 4.7 发布,视觉与记忆能力全面增强

这家总部位于旧金山的AI初创公司将此次发布定位为迄今为止功能最强大的公开可用模型。这是对仅在两个月前(2月)发布的Opus 4.6版本的一次针对性升级。

虽然受限的Claude Mythos预览版仍处于网络安全领域的有限测试阶段,但Opus 4.7专为更广泛的市场打造。它特别专注于软件工程、长期任务以及复杂的财务分析。

Anthropic 发布的性能指标显示,该模型在自动化工作流方面取得了显著进步。在 SWE-bench Verified 编码基准测试中,新模型的准确率达到 87.6%,高于 4.6 版本的 80.8%。

Anthropic Debuts Claude Opus 4.7 as Agentic Workflows Take Center Stage
Anthropic基准测试。

该模型还在多个关键类别中成功超越了主要竞争对手。Anthropic报告称,在工具使用和计算机交互测试中,Opus 4.7的表现优于OpenAI的GPT-5.4和谷歌的Gemini 3.1 Pro。

最显著的改进之一是模型视觉能力的重大升级。Claude Opus 4.7 现可处理长边最大达 2,576 像素的图像,是此前分辨率限制的三倍。

这一视觉能力的提升使该AI能够更好地解读复杂的图表、用户界面和技术示意图。不过,该公司指出,高分辨率图像会消耗更多令牌,这可能会增加高使用量用户的成本。 Anthropic还在其Claude Code环境中推出了一项名为/ultrareview的新功能。该工具允许专业版和最高级别的用户运行多代理会话,以识别软件中的错误和设计缺陷。

对于金融专业人士而言,该模型在经济建模方面展现出更高的严谨性。其在通用金融模块上获得了0.813的评分,较上一版本0.767的评分实现了显著提升。

该模型的定价结构保持不变,输入令牌每百万计费 5 美元,输出令牌每百万计费 25 美元。为帮助管理长时间自主运行期间的费用,Anthropic 已将任务预算功能纳入公开测试版。

一丝不苟地执行指令

开发者社区的早期反馈表明,该模型在遵循指令方面更加字面化。这一变化可能要求用户重新调整那些针对Claude家族旧版本优化的现有提示词。 “Claude 4.7已发布,使用它感觉就像坐进了一辆F1赛车。动力远超以往,而且它会全速精准执行你的指令。 你的任务就是选定方向并完成转向,”一位用户在 X 上写道。 部分测试者观察到,更新后的令牌化器在处理相同输入时,使用的令牌数量最多可达 1.35 倍。虽然这可能导致配额更快耗尽,但该公司认为,其每项任务的性能表现足以证明这种资源使用是合理的。

Crossmint的Lobster.cash整合万事达卡Agent Pay,助力代理商电商业务

Crossmint的Lobster.cash整合万事达卡Agent Pay,助力代理商电商业务

Lobster.cash 集成了 Mastercard Agent Pay 服务,因此 Openclaw AI 代理可以使用持卡人现有的银行卡进行交易,同时受发卡机构的管控。 read more.

立即阅读

安全性依旧是核心关注点,该模型新增了自动防护机制,用于阻止高风险的网络安全用途。Anthropic的系统简介强调了模型诚实度的提升,以及对生成有害内容的更强抵抗力。 该模型现已通过Claude API、Amazon Bedrock、Google Vertex AI和Microsoft Foundry提供。它保留了今年早些时候引入的100万令牌上下文窗口。