社区有人用 /goal 连续跑 21 小时烧掉 9 亿 token — OpenAI 把 AI 编程助手从“对话工具”变成了“无人值守工人”。
这是什么
/goal 是 OpenAI 4月30日在 Codex CLI(命令行编程工具)0.128.0 版本新增的命令。不是普通提示词,而是一套目标生命周期管理机制:你给一个目标,Codex 自己一轮轮推进,直到完成、被暂停或烧到 token 上限才停。
四层架构支撑这个机制:持久化层把目标存为独立状态,压缩对话历史不会丢目标;接口层让客户端可读写状态;模型工具层只允许模型查询和声明完成,不能自己暂停或篡改——这是安全边界;运行时延续层每轮空闲自动注入提示词,驱动下一步。
最值得注意的设计是“完成审计”。模型判定目标达成前,必须把目标映射成具体交付物清单,用真实证据逐一验证。不能依赖“测试过了”“写了代码”这类辅助信号。这针对的是模型在长任务中早早声称做完然后偷懒的倾向。
Token 预算是软停止:烧到上限不会粗暴中断,而是让模型收尾、总结进度、列剩余工作,第二天打开终端拿到能看懂的报告。
行业怎么看
正面声音认为这是 AI 编程从“助手”走向“自主工作者”的关键一步。以前用 AI 写代码得一直盯着;现在给个目标,第二天验收。对批量重构、补测试、修 bug 这类重复任务,效率提升明显。OpenAI 总裁 Greg Brockman 称之为“内置的 Ralph Loop++”(Ralph Loop 指用脚本反复驱动 agent 跑同一目标的工作流),内置版支持跨会话恢复、无需每轮重建上下文,产出质量更稳。
但我们注意到三个风险:一是成本失控。21 小时烧 9 亿 token,目标设定不当或比预期复杂,账单难看。虽有 token 预算上限,但只是软停止,前面消耗已无法回收。二是跑偏。Issue #19910 报告:模型调用中间触发上下文压缩时,延续提示词不会重新注入,后续轮次可能丢失目标。超长任务的稳定性仍需观察。三是场景有限。/goal 适合重复性、可清单化的批量任务;需频繁人工判断的探索性任务,用它反而费 token 且容易卡死。
对普通人的影响
对企业 IT:代码迁移、技术债清理这类苦活,可以用 /goal 实现“设定目标—第二天验收”,但需先建立 token 预算管控和目标验收流程,否则成本敞口太大。
对个人职场:程序员工作重心进一步从“写代码”转向“定义目标和验收结果”。能清晰拆解任务、写出可审计目标的人,比只会写代码的人更适配这类工具。
对消费市场:暂无直接影响。/goal 是开发者工具,但其设计思路——目标持久化、完成审计、预算控制——很可能被其他 AI 产品借鉴,出现在面向普通用户的自动化场景中。