Anthropic 将 Agent 大脑与执行层解耦：托管 Agent 架构详解

发生了什么

Anthropic 发布了一篇题为 Scaling Managed Agents: Decoupling the brain from the hands 的技术架构文章，详细阐述了基于 Claude 的 Agent 系统的五组件拆解方案。该设计将 Session、Harness、Sandbox、Tools/MCP 和 Orchestration 分离为可独立替换的模块，通过稳定的接口相互连接——这与当前生产环境中普遍采用的单体 Agent 循环模式截然不同。

此次发布属于架构层面的阐述，而非新产品的发布。根据相关分析，Anthropic 的既定目标并非推出新的模型能力，而是定义组件间可恢复、具备容错性的协作契约，确保 Agent 系统在长时间运行的任务中保持稳定运转。

为何值得关注

目前，大多数基于 Claude 构建 Agent 的工程团队都采用单容器模式：Agent 循环、上下文、工具执行和文件系统全部集中部署。这种方式在演示阶段运行良好，却在生产环境中频繁出问题——容器死锁、上下文污染、崩溃恢复需要对线上系统进行实时调试。

Anthropic 的新架构在结构层面做出了三个关键判断，对使用其 API 的开发团队具有直接影响：

故障域大幅收窄。 Sandbox 崩溃会以 execute() 调用失败的形式呈现给 Harness，而不会演变为整个 Session 终止的事件。Harness 可以进行重试、切换执行层，或以优雅降级的方式继续运行。
恢复成为一等公民。 Orchestration 层的 wake(session_id) 接口专为恢复被中断的任务而设计，而非重新启动。Harness 通过读取 getEvents(session_id)，从仅追加的 Session 日志中重建状态，再发起新的工具调用。
凭证安全由结构保障，而非依赖提示词。 Anthropic 明确指出，将凭证置于模型可访问的环境中，本质上是在赌模型不会主动获取它们——而随着模型能力的提升，这个赌注只会越来越不划算。在新架构下，Git 访问权限在 provision() 阶段以远程能力的形式注入；MCP 和 OAuth 凭证则通过作用域限定在单个 Session 的 vault 代理流转。

对 CTO 而言，这里存在一个二阶效应：如果这套接口契约成为 Claude Agent 部署的事实标准，那些已经完成架构拆解的团队，将在吸收模型升级时占据明显优势，无需重写 Orchestration 逻辑。

技术细节

五组件接口体系

该架构定义了三组关键接口：

Session 接口 —— 位于上下文窗口之外的仅追加事件账本：

getSession(session_id) —— 获取 Session 元数据及事件范围，用于恢复逻辑
getEvents(session_id) —— 获取待处理或指定范围内的事件，以重建当前任务进度
emitEvent(id, event) —— 在每一步执行完成后立即将输出作为检查点追加写入

Orchestration 接口：

wake(session_id) —— 当检测到待处理事件或触发重试时重新激活 Session；将调度策略与业务逻辑解耦

Sandbox 接口：

provision({resources}) —— 在任何推理开始之前，以代码仓库、依赖项和凭证代理初始化执行环境
execute(name, input) → String —— 将具体操作路由至执行层；向 Harness 返回字符串结果，供下一步决策使用

Session 日志与上下文窗口的区别

一个关键的架构决策是将 Session 视为持久化的外部记录，而非模型上下文窗口的延伸。上下文窗口负责处理当前的工作状态，Session 日志则保存完整、未压缩的历史记录。这一设计解决了长时间运行任务中的三类故障：需要有损压缩的上下文长度溢出、因消息重排序导致的语义漂移，以及关键步骤输出在被下游引用前就遭截断的问题。

懒加载 Sandbox 初始化与 TTFT 的影响

在此前的模式下，无论是否需要执行操作，容器冷启动都会阻塞每个 Session 的首 token 生成。新架构将 provision() 推迟到 Harness 判断确实需要执行时才触发。根据引用 Anthropic 原文的分析资料，这一改动将 p50 首 token 时间（TTFT）降低了约 60%，p95 降幅更超过 90%。

值得持续关注的方向

API 接口的正式化。 Anthropic 目前描述了一套接口契约，但据现有信息，这些接口尚未以版本化公开 API 的形式发布。请关注 SDK 或 API 变更日志，留意 Session 和 Orchestration 原语是否在未来 30 天内直接向开发者开放。
MCP 集成深度。 该架构将 MCP 定位为外部能力与数据摄取层。Anthropic 持续推进的 MCP 标准化工作，或将产出文中描述的 vault 代理凭证模式的参考实现。
OpenAI 与 Google 的竞争回应。 OpenAI 的 Assistants API 和 Google 的 Agent Development Kit 均采用单体循环模式的变体。若 Anthropic 的解耦架构在长任务可靠性上展现出可量化的优势，预计两家公司将在 2025 年第三季度内相继发布架构层面的公告。
企业采用信号。 在生产环境中运行数小时编码或数据处理任务的 Claude 用户，是此架构最直接的目标受众。请关注相关案例研究或开发者反馈，观察 wake() 恢复路径在真实中断场景下的表现是否可靠。

Anthropic 将 Agent 大脑与执行层解耦：托管 Agent 架构详解

发生了什么

为何值得关注

技术细节

五组件接口体系

Session 日志与上下文窗口的区别

懒加载 Sandbox 初始化与 TTFT 的影响

值得持续关注的方向

相关推荐

Anthropic 推出 Claude Fable，但更强不等于更可用，安全阉割成了核心卖点

AWS 把芯片调优交给 AI 代理，Trainium 的门槛开始从专家能力变成工具能力

Anthropic 提出给更强 AI 设“暂停键”，这不是保守，而是在抢规则制定权

25 小时写出 3 万行代码，开发者正从 Copilot 转向 AI 自主循环

一个启动就挂多台 MCP 服务器的小问题，暴露了 AI 工具落地的真瓶颈

本地模型开始够用简单网页任务，但离替代 Claude 还差一层稳定性