发生了什么

Anthropic 发布了一篇题为 Scaling Managed Agents: Decoupling the brain from the hands 的技术架构文章,详细阐述了基于 Claude 的 Agent 系统的五组件拆解方案。该设计将 Session、Harness、Sandbox、Tools/MCP 和 Orchestration 分离为可独立替换的模块,通过稳定的接口相互连接——这与当前生产环境中普遍采用的单体 Agent 循环模式截然不同。

此次发布属于架构层面的阐述,而非新产品的发布。根据相关分析,Anthropic 的既定目标并非推出新的模型能力,而是定义组件间可恢复、具备容错性的协作契约,确保 Agent 系统在长时间运行的任务中保持稳定运转。

为何值得关注

目前,大多数基于 Claude 构建 Agent 的工程团队都采用单容器模式:Agent 循环、上下文、工具执行和文件系统全部集中部署。这种方式在演示阶段运行良好,却在生产环境中频繁出问题——容器死锁、上下文污染、崩溃恢复需要对线上系统进行实时调试。

Anthropic 的新架构在结构层面做出了三个关键判断,对使用其 API 的开发团队具有直接影响:

  • 故障域大幅收窄。 Sandbox 崩溃会以 execute() 调用失败的形式呈现给 Harness,而不会演变为整个 Session 终止的事件。Harness 可以进行重试、切换执行层,或以优雅降级的方式继续运行。
  • 恢复成为一等公民。 Orchestration 层的 wake(session_id) 接口专为恢复被中断的任务而设计,而非重新启动。Harness 通过读取 getEvents(session_id),从仅追加的 Session 日志中重建状态,再发起新的工具调用。
  • 凭证安全由结构保障,而非依赖提示词。 Anthropic 明确指出,将凭证置于模型可访问的环境中,本质上是在赌模型不会主动获取它们——而随着模型能力的提升,这个赌注只会越来越不划算。在新架构下,Git 访问权限在 provision() 阶段以远程能力的形式注入;MCP 和 OAuth 凭证则通过作用域限定在单个 Session 的 vault 代理流转。

对 CTO 而言,这里存在一个二阶效应:如果这套接口契约成为 Claude Agent 部署的事实标准,那些已经完成架构拆解的团队,将在吸收模型升级时占据明显优势,无需重写 Orchestration 逻辑。

技术细节

五组件接口体系

该架构定义了三组关键接口:

Session 接口 —— 位于上下文窗口之外的仅追加事件账本:

  • getSession(session_id) —— 获取 Session 元数据及事件范围,用于恢复逻辑
  • getEvents(session_id) —— 获取待处理或指定范围内的事件,以重建当前任务进度
  • emitEvent(id, event) —— 在每一步执行完成后立即将输出作为检查点追加写入

Orchestration 接口

  • wake(session_id) —— 当检测到待处理事件或触发重试时重新激活 Session;将调度策略与业务逻辑解耦

Sandbox 接口

  • provision({resources}) —— 在任何推理开始之前,以代码仓库、依赖项和凭证代理初始化执行环境
  • execute(name, input) → String —— 将具体操作路由至执行层;向 Harness 返回字符串结果,供下一步决策使用

Session 日志与上下文窗口的区别

一个关键的架构决策是将 Session 视为持久化的外部记录,而非模型上下文窗口的延伸。上下文窗口负责处理当前的工作状态,Session 日志则保存完整、未压缩的历史记录。这一设计解决了长时间运行任务中的三类故障:需要有损压缩的上下文长度溢出、因消息重排序导致的语义漂移,以及关键步骤输出在被下游引用前就遭截断的问题。

懒加载 Sandbox 初始化与 TTFT 的影响

在此前的模式下,无论是否需要执行操作,容器冷启动都会阻塞每个 Session 的首 token 生成。新架构将 provision() 推迟到 Harness 判断确实需要执行时才触发。根据引用 Anthropic 原文的分析资料,这一改动将 p50 首 token 时间(TTFT)降低了约 60%,p95 降幅更超过 90%。

值得持续关注的方向

  • API 接口的正式化。 Anthropic 目前描述了一套接口契约,但据现有信息,这些接口尚未以版本化公开 API 的形式发布。请关注 SDK 或 API 变更日志,留意 Session 和 Orchestration 原语是否在未来 30 天内直接向开发者开放。
  • MCP 集成深度。 该架构将 MCP 定位为外部能力与数据摄取层。Anthropic 持续推进的 MCP 标准化工作,或将产出文中描述的 vault 代理凭证模式的参考实现。
  • OpenAI 与 Google 的竞争回应。 OpenAI 的 Assistants API 和 Google 的 Agent Development Kit 均采用单体循环模式的变体。若 Anthropic 的解耦架构在长任务可靠性上展现出可量化的优势,预计两家公司将在 2025 年第三季度内相继发布架构层面的公告。
  • 企业采用信号。 在生产环境中运行数小时编码或数据处理任务的 Claude 用户,是此架构最直接的目标受众。请关注相关案例研究或开发者反馈,观察 wake() 恢复路径在真实中断场景下的表现是否可靠。