一个核心变化是:Agent 的竞争点,已经不只是模型会不会回答,而是能不能在调用工具失败、信息不全时继续把事办完。我们判断,CoT(思维链,指把推理步骤拆开)到 ReAct(推理+行动,让模型边想边调工具)的演进,真正补上的不是“更聪明”,而是“更像一个能交付结果的系统”。
这是什么
这篇文章讲的是,智能 Agent 为什么不能只靠大模型“想”,还必须学会“做”和“改”。CoT 先解决了一个问题:让模型别急着给结论,而是分步骤推理,减少拍脑袋回答。它适合数学题、分析题,也让错误更容易定位。
但 CoT 有明显边界:它还是在模型脑子里打转,无法核实真实订单、库存、退款状态。ReAct 则是在 CoT 基础上再加一层行动闭环:先思考,再调用工具,再观察结果,再决定下一步。简单说,AI 不再只“解释世界”,而是开始“接触世界”。
文章还提到一个更接近生产环境的重点:双层容错。第一层是代码兜底,把接口超时、参数错误这类异常变成可读信息;第二层是模型纠错,让 Agent 根据失败原因决定重试、换工具,还是向用户澄清。这个设计比“接了多少工具”更重要,因为大多数系统不是死在不会调用,而是死在第一次调用失败后就停住。
行业怎么看
行业普遍认同,ReAct 是 Agent 从演示走向业务的关键框架之一。原因很现实:企业真正需要的不是一个会侃侃而谈的机器人,而是一个能查系统、走流程、遇错不崩的数字员工。客服、报销、订单查询、知识检索,都是这类场景。
但值得我们关心的是,ReAct 也容易被包装得过于乐观。第一,调用工具越多,链路越长,延迟、成本和失败率也会同步上升;第二,模型如果把错误“合理化”,也可能在错误前提上持续行动,形成更隐蔽的风险;第三,很多企业内部系统权限复杂、接口老旧,Agent 的问题常常不是推理不够强,而是根本接不进去。
换句话说,ReAct 不是一把万能钥匙。它更像一种工程方法:把模型、工具、日志、权限、异常处理拼成一个闭环。没有这些基础设施,Agent 看起来会思考,实际上很难稳定交付。
对普通人的影响
对企业 IT:重点会从“接入哪个大模型”转向“怎么设计工具链和容错”。未来能否上线,不只看回答效果,还要看审计、权限、重试和监控是否齐全。
对个人职场:很多白领接触到的 AI,会从写文案、做总结,逐步变成能查数据、填表单、跑流程的助手。会不会把业务流程拆清楚,开始比会不会写提示词更重要。
对消费市场:用户会更少听到“系统异常请稍后再试”,更多遇到能自己补救一步的 AI 客服。但这也意味着,大家需要更留意它到底是在用真实数据办事,还是只是把话说得更像那么回事。