Article Not Found

发生了什么

Anthropic 于 4 月 16 日正式发布 Claude Opus 4.7，此次更新聚焦于两项具体能力短板：代码可靠性与视觉分辨率。据金句来源平台掘金的报道，本次发布维持现有定价不变。

在编程基准测试方面，Opus 4.7 在真实 GitHub 编程问题上的复杂任务解题率达到 64.3%——据原文报道，较上一代提升了 10 个百分点。这一提升归功于全新的自验证机制：模型在返回结果前会对自身输出进行内部审查，在内部捕获逻辑错误，而非将其暴露给用户。

据原文报道，Replit 和 Warp 的早期访问开发者反映，模型现在会在需求模糊时主动请求澄清，而非生成推测性代码。

为何重要

在真实 GitHub 任务上提升 10 个百分点，是一个实质性的进步。SWE-bench 类评估被业界普遍认为比合成基准更难刷分，因为它需要在真实代码仓库上完成端到端的补丁生成。如果 64.3% 的数据能通过独立评估的验证，将有效缩小与竞争对手专注编程领域模型之间的差距。

维持定价不变的决策具有重要的战略意义。在多家竞争对手相继上调 API 价格之际，Anthropic 选择自行承担算力成本上涨的压力。对于运行大规模编程 Agent 的企业而言，稳定的定价能降低总拥有成本的不确定性——这是在采购决策上对抗竞品的直接论据。

此外，对进攻性网络安全能力的刻意抑制同样值得关注。Anthropic 通过训练约束明确削弱了模型的攻击生成能力，以换取在特定安全基准上的较低分数。这一举措使公司在应对欧盟 AI 法案及美国行政令框架中有关双重用途 AI 能力的预期监管要求方面，抢占了先机。

技术细节

视觉能力：支持长边 2,576px

图像最大分辨率提升至长边 2,576 像素——据原文描述，较上一版本的有效视觉精度提升约 3 倍。这使模型能够处理密集的金融图表、化学结构图以及高保真设计稿，而无需因降采样导致大量细节丢失。

自验证架构

自验证功能在代码返回给调用方之前增加了一个内部审查环节。模型会在同一推理周期内识别自身生成方案中的逻辑漏洞并加以修正。开发者侧无需额外的 API 调用，但对于复杂任务，这可能会增加单次请求的延迟和 token 消耗。

新增开发者控制项

xhigh 努力等级：在现有努力设置之上新增一个档位，让开发者能更精细地在推理深度与响应速度之间进行权衡。
任务预算 / token 上限：开发者可为每项任务设置 token 消耗的硬性上限，防止 Agent 工作流中模型无限迭代导致的成本失控。
Claude Code 中的 /ultrareview 命令：一个专用代码审查命令，对提交的代码块执行自动化 Bug 检测。

安全约束

Anthropic 确认通过训练阶段的约束，对进攻性网络安全能力进行了刻意降级，并加入了自动拦截机制以阻断攻击向量的生成。原文指出，这导致模型在特定安全类别基准测试中的得分略有下降——这是公司坦然接受并公开说明的刻意取舍。

值得关注的后续动态

独立基准复现（未来 14 天）：64.3% 的 SWE-bench 数据有待第三方确认。预计学术界和社区将在发布后两周内完成重新测试。
Replit 与 Warp 集成（未来 30 天）：两家公司均参与了早期访问。关注其工程团队发布的正式集成公告或量化生产力指标。
竞争对手的应对：OpenAI 的 GPT-4. 1 编程档位和 Google 的 Gemini 2.5 Pro 是直接的对标竞品。64 .3% 的真实 GitHub 任务解题率将向两家公司施压，促使其发布更新的基准数据或推出能力层面的反击。
token 预算 API 的采用情况：任务预算功能是生产级 Agent 部署的直接使能器。其采用率将反映有多少企业团队正在以自主模式而非交互模式运行 Opus。
监管合规信号：Anthropic 主动抑制网络安全能力的举措，或将在即将到来的欧盟 AI 法案合规讨论中被援引。关注 Q2 的官方政策声明。

Claude Opus 4.7 Launches: 64.3% S WE-Bench Score, Higher Image Resolution

发生了什么

为何重要

技术细节

视觉能力：支持长边 2,576px

自验证架构

新增开发者控制项

安全约束

值得关注的后续动态

Related Reading

GPT- 5.5 Tops Every Benchmark, Edges Out Opus 4.7 — OpenAI Strikes Back

The One Thing You Must Do with Claude Code: Sign a Contract ( CLAUDE.md)

Pro Users Locked Out of Claude Code Unless They Pay $100/ Mo for Max

Anthropic's Claude Code Source Leak : 510 K Lines Reveal How It Saves You Money

Connecting Obsidian to Claude Code: Long -Term AI Memory in 400 Lines

Spec -Driven Development with OpenSpec

Claude Opus 4.7 Launches: 64.3% S WE-Bench Score, Higher Image Resolution

发生了什么

为何重要

技术细节

视觉能 力：支持长边 2,576px

自验证 架构

新增开发者控制项

安全约束

值得关注的后续动态

Related Reading

GPT- 5.5 Tops Every Benchmark, Edges Out Opus 4.7 — OpenAI Strikes Back

The One Thing You Must Do with Claude Code: Sign a Contract ( CLAUDE.md)

Pro Users Locked Out of Claude Code Unless They Pay $100/ Mo for Max

Anthropic's Claude Code Source Leak : 510 K Lines Reveal How It Saves You Money

Connecting Obsidian to Claude Code: Long -Term AI Memory in 400 Lines

Spec -Driven Development with OpenSpec

视觉能力：支持长边 2,576px

自验证架构