Harness Engineering：正在成为 AI 工程核心discipline的关键实践

发生了什么

OpenAI 与 Anthropic 已双双正式将 Harness Engineering 确立为一门独立的工程discipline，使其区别于提示词工程（prompt engineering）和 Agent 工具链开发。OpenAI 在 2026 年 2 月发布的一篇文章中率先提出这一实践，该文聚焦于如何在以 Codex 为核心的 Agent 优先世界中高效运作。Anthropic 随后在 2025 年底及 2026 年 3 月的工程博客中跟进，明确指出：前沿 Agent 的代码生成性能越来越依赖于 harness 设计，而非模型本身的原始能力。目前，这一术语已在中国及全球技术社区中高频传播。

两家公司的核心论断一致：在使用相同模型的前提下，harness 工程设计更优的团队将持续跑赢那些仅仅升级了模型的团队。在生产级 AI 部署中，harness——而非模型——才是真正的差异化变量。

为什么重要

这一定性判断，对任何在生产系统中部署基于 LLM 的 Agent 的团队而言，都具有深远的组织架构层面影响。

招聘方向与岗位定义正在转变：团队开始区分提示词工程师（优化单次输出质量）与 harness 工程师（优化多步骤任务完成率与系统可靠性）。这是两种截然不同的岗位，不可混为一谈。
模型商品化进程加速：若 harness 设计才是差异化所在，模型选型便退居次要地位。这一趋势强化了基础模型的商品化轨迹，同时增加了基础设施与工具链厂商的市场议价空间。
DevOps 与平台工程加速向 AI 融合：Harness engineering 借鉴了既有工程discipline的核心方法——访问控制、可观测性、回滚机制、审计日志——并将其针对性地应用于在长周期任务中运行的非确定性 AI Agent。平台工程团队是最自然的责任归属方，但大多数团队目前尚未具备相应能力。
风险面是组织层面的，而非仅限于技术层面：如原文所直言，权限配置错误或缺乏充分反馈机制的 Agent，就是一台「事故生成器」。其失效模式并非产出错误的模型输出，而是在缺乏足够约束的情况下自主采取行动。

技术细节

综合 OpenAI 公开的 Codex 工作流与 Anthropic 的 Agent 工程博客，一套生产级 harness 由五个功能层构成：

1. 任务边界定义

Agent 在执行前必须获得明确的范围约束。示例约束包括：目录级写入限制、Schema 变更禁令、强制性测试通过门控、合并操作的人工审批要求。若缺乏这些约束，Agent 将以任何可用手段优化任务完成率——包括具有破坏性的手段。

2. Context 管理

OpenAI 明确将 context 定性为稀缺资源。context 并非越多越好；结构不当的 context 会导致 Agent 朝错误方向优化。Harness engineering 决定哪些文档、哪些历史 PR、哪些规范被呈递给 Agent，并以机器可读的方式组织它们，而非面向人类可读性。这正是结构化的 AGENTS.md 文件与清晰的代码仓库组织方式如今已成为工程要求——而非风格偏好——的根本原因。

3. 最小权限工具链

Harness 控制 Agent 可调用的工具及其对应的权限级别。以 Kubernetes 可观测性场景为例，正确的 harness 问题不是「Agent 能否使用 kubectl」，而是：exec 是否被允许？secrets 是否可访问？跨命名空间查询是否开放？生产集群访问范围是否已收窄？是否强制使用附带完整审计日志的短期令牌？每一项权限都是显式决策，而非默认配置。

4. 反馈回路

OpenAI 的 Codex 部署方案将浏览器调试、DOM 快照、截图捕获、页面导航工具及可观测性埋点直接集成至 Agent 运行时。这使 Agent 能够在提交 Pull Request 前自行复现 Bug、验证修复方案并确认结果。若缺乏反馈回路，Agent 将在没有任何信号的情况下运行，持续输出猜测，而非经过验证的解决方案。

5. 护栏与审计

Harness 强制执行硬性终止规则：无确认不得删除资源、不得读取敏感数据、不得直接部署至生产环境、不得绕过审批流程、不得在授权范围外执行高风险命令。所有操作均留存审计日志。这一层级是受控 Agent 与拥有生产系统不受约束写入权限的自治进程之间的本质区别。

两家公司目前均在内部沿用同一公式：Agent = Model + Harness。模型决定能力上限，harness 决定该上限中有多大比例可在生产环境中被安全调用。

值得关注的动向

工具链市场成形（未来 30 天）：关注初创公司及成熟 DevOps 厂商是否开始将产品明确定位为 harness 基础设施——涵盖权限管理、context 流水线、Agent 可观测性等方向。相关词汇已具备市场共识，产品发布潮将随之而来。
Anthropic 工程博客：2026 年 3 月的这篇文章是系列内容的一部分，后续预计将发布关于长周期 Agent harness 设计模式的更多技术规范。
OpenAI Codex 文档更新：随着 Codex 在 Agent 工作流中的部署范围持续扩大，预计将出现更完善的官方指南，涵盖代码仓库结构与 AGENTS.md 规范，从而在行业层面实际确立 harness 设计惯例。
企业安全团队的应对：SOC 与合规团队需要借助现有的最小权限框架，对 Agent 权限模型展开评估。随着 Codex 大规模落地，首批因 Agent 工具访问权限配置错误而引发的企业审计失败事件，预计将在 60 至 90 天内出现。
职位描述的变化：持续追踪 AI 原生公司的高级工程岗位招聘信息，重点关注是否出现明确提及 harness engineering、Agent 基础设施或 Agent 可靠性的职责描述——这是该discipline正式化速度最具前瞻性的指示信号。

Harness Engineering：正在成为 AI 工程核心discipline的关键实践

发生了什么

为什么重要

技术细节

1. 任务边界定义

2. Context 管理

3. 最小权限工具链

4. 反馈回路

5. 护栏与审计

值得关注的动向

相关推荐

Claude Code 一口气放出 35 个插件，AI 编程开始从问答走向流程化

Anthropic 推出 Claude Fable，但更强不等于更可用，安全阉割成了核心卖点

Anthropic 提出给更强 AI 设“暂停键”，这不是保守，而是在抢规则制定权

25 小时写出 3 万行代码，开发者正从 Copilot 转向 AI 自主循环

llama.cpp 把网页界面做成可安装应用，本地大模型离日常使用又近了一步

Kimi K2.7 Code 把推理开销再降 30%，国产代码 Agent 开始比拼交付效率