发生了什么

Meta 的工程团队遇到了一个具体问题:指向大型内部数据管道(涵盖 4 个 Python、C++ 和 Hack 仓库,包含 4100 多个文件)的 AI 编码代理速度过慢且准确性不足,无法实用。这些代理缺乏对系统实际运作方式的理解。

他们的解决方案是一个预计算引擎:由 50 多个专用 AI 代理组成的集群,读取每个文件并生成 59 个结构化上下文文件,编码了 Meta 所称的“隐性知识”(tribal knowledge)——即设计决策、非显而易见的模式以及跨仓库关系,这些此前仅存在于工程师的脑海中。

  • 导航指南现已覆盖 100% 的代码模块,此前仅为 5%
  • 记录了 50 多个非显而易见的模式(例如:两种配置模式使用不同的字段名表示同一操作)
  • 初步测试显示,每项任务的 AI 代理工具调用次数减少了 40%
  • 该知识层与模型无关,可与大多数主流 LLM 配合使用

该系统具备自维护能力:自动化作业每隔几周运行一次,以验证文件路径、检测覆盖缺口、重新运行质量评估器并修复过时的引用。

为何重要

大多数使用 AI 编码助手的团队都遇到了 Meta 所面临的同样困境——模型本身具备能力,但缺乏针对特定代码库的地图。本文展示了一种可复用的架构来解决这一问题。预计算方法将知识提取与任务执行分离,这意味着你可以在不重建上下文层的情况下更换模型。对于独立开发者和中小企业而言,关键洞察在于:前期投资构建结构化的代码库文档,不仅能提升人类入职效率,更能显著提高代理效率。

亚太视角

在亚太地区,构建多仓库微服务架构的中国和东南亚开发团队——这在金融科技、物流和 SaaS 平台中非常普遍——同样面临着规模化的隐性知识问题。使用 Qwen、DeepSeek 或其他本地部署模型的团队可以应用这一模式:一次性构建预计算上下文层,然后在不同模型版本间复用。这对于正在走向全球化的团队尤为相关,他们需要让新工程师或 AI 代理快速上手复杂的遗留代码库,而无需依赖资深工程师作为瓶颈。

本周行动项

在你的代码库中选择一个 AI 建议 consistently 出错或需要大量修正的模块。编写一个单一的上下文文件,记录其非显而易见的模式、命名约定和跨模块依赖关系。测试在提示上下文包含该文件后,你的 AI 助手是否生成了更好的编辑。这就是 Meta 自动化方案的简化手动版本。