发生了什么

OpenAI 与 Anthropic 已双双正式将 Harness Engineering 确立为一门独立的工程discipline,使其区别于提示词工程(prompt engineering)和 Agent 工具链开发。OpenAI 在 2026 年 2 月发布的一篇文章中率先提出这一实践,该文聚焦于如何在以 Codex 为核心的 Agent 优先世界中高效运作。Anthropic 随后在 2025 年底及 2026 年 3 月的工程博客中跟进,明确指出:前沿 Agent 的代码生成性能越来越依赖于 harness 设计,而非模型本身的原始能力。目前,这一术语已在中国及全球技术社区中高频传播。

两家公司的核心论断一致:在使用相同模型的前提下,harness 工程设计更优的团队将持续跑赢那些仅仅升级了模型的团队。在生产级 AI 部署中,harness——而非模型——才是真正的差异化变量。

为什么重要

这一定性判断,对任何在生产系统中部署基于 LLM 的 Agent 的团队而言,都具有深远的组织架构层面影响。

  • 招聘方向与岗位定义正在转变:团队开始区分提示词工程师(优化单次输出质量)与 harness 工程师(优化多步骤任务完成率与系统可靠性)。这是两种截然不同的岗位,不可混为一谈。
  • 模型商品化进程加速:若 harness 设计才是差异化所在,模型选型便退居次要地位。这一趋势强化了基础模型的商品化轨迹,同时增加了基础设施与工具链厂商的市场议价空间。
  • DevOps 与平台工程加速向 AI 融合:Harness engineering 借鉴了既有工程discipline的核心方法——访问控制、可观测性、回滚机制、审计日志——并将其针对性地应用于在长周期任务中运行的非确定性 AI Agent。平台工程团队是最自然的责任归属方,但大多数团队目前尚未具备相应能力。
  • 风险面是组织层面的,而非仅限于技术层面:如原文所直言,权限配置错误或缺乏充分反馈机制的 Agent,就是一台「事故生成器」。其失效模式并非产出错误的模型输出,而是在缺乏足够约束的情况下自主采取行动。

技术细节

综合 OpenAI 公开的 Codex 工作流与 Anthropic 的 Agent 工程博客,一套生产级 harness 由五个功能层构成:

1. 任务边界定义

Agent 在执行前必须获得明确的范围约束。示例约束包括:目录级写入限制、Schema 变更禁令、强制性测试通过门控、合并操作的人工审批要求。若缺乏这些约束,Agent 将以任何可用手段优化任务完成率——包括具有破坏性的手段。

2. Context 管理

OpenAI 明确将 context 定性为稀缺资源。context 并非越多越好;结构不当的 context 会导致 Agent 朝错误方向优化。Harness engineering 决定哪些文档、哪些历史 PR、哪些规范被呈递给 Agent,并以机器可读的方式组织它们,而非面向人类可读性。这正是结构化的 AGENTS.md 文件与清晰的代码仓库组织方式如今已成为工程要求——而非风格偏好——的根本原因。

3. 最小权限工具链

Harness 控制 Agent 可调用的工具及其对应的权限级别。以 Kubernetes 可观测性场景为例,正确的 harness 问题不是「Agent 能否使用 kubectl」,而是:exec 是否被允许?secrets 是否可访问?跨命名空间查询是否开放?生产集群访问范围是否已收窄?是否强制使用附带完整审计日志的短期令牌?每一项权限都是显式决策,而非默认配置。

4. 反馈回路

OpenAI 的 Codex 部署方案将浏览器调试、DOM 快照、截图捕获、页面导航工具及可观测性埋点直接集成至 Agent 运行时。这使 Agent 能够在提交 Pull Request 前自行复现 Bug、验证修复方案并确认结果。若缺乏反馈回路,Agent 将在没有任何信号的情况下运行,持续输出猜测,而非经过验证的解决方案。

5. 护栏与审计

Harness 强制执行硬性终止规则:无确认不得删除资源、不得读取敏感数据、不得直接部署至生产环境、不得绕过审批流程、不得在授权范围外执行高风险命令。所有操作均留存审计日志。这一层级是受控 Agent 与拥有生产系统不受约束写入权限的自治进程之间的本质区别。

两家公司目前均在内部沿用同一公式:Agent = Model + Harness。模型决定能力上限,harness 决定该上限中有多大比例可在生产环境中被安全调用。

值得关注的动向

  • 工具链市场成形(未来 30 天):关注初创公司及成熟 DevOps 厂商是否开始将产品明确定位为 harness 基础设施——涵盖权限管理、context 流水线、Agent 可观测性等方向。相关词汇已具备市场共识,产品发布潮将随之而来。
  • Anthropic 工程博客:2026 年 3 月的这篇文章是系列内容的一部分,后续预计将发布关于长周期 Agent harness 设计模式的更多技术规范。
  • OpenAI Codex 文档更新:随着 Codex 在 Agent 工作流中的部署范围持续扩大,预计将出现更完善的官方指南,涵盖代码仓库结构与 AGENTS.md 规范,从而在行业层面实际确立 harness 设计惯例。
  • 企业安全团队的应对:SOC 与合规团队需要借助现有的最小权限框架,对 Agent 权限模型展开评估。随着 Codex 大规模落地,首批因 Agent 工具访问权限配置错误而引发的企业审计失败事件,预计将在 60 至 90 天内出现。
  • 职位描述的变化:持续追踪 AI 原生公司的高级工程岗位招聘信息,重点关注是否出现明确提及 harness engineering、Agent 基础设施或 Agent 可靠性的职责描述——这是该discipline正式化速度最具前瞻性的指示信号。