01 触发事件
5 月 18 日,xAI 宣布在网页端、iOS 和 Android 同步上线 Grok 的 Skills 功能。
36kr 的关键信息很直接:用户教 Grok 一次特定任务后,它可以在后续独立对话中永久记住个人偏好、格式规则和工作流步骤,不必每次重输前置 prompt。
这不是一次普通的“记忆功能”更新。
这是把原本一次性的 chat session,往“跨 session 可复用的执行层”推进了一步。
我没在内部跑过 xAI 的实现,也不知道它到底是 system-level memory、profile store、还是某种 prompt template 封装;但仅从产品描述看,xAI 正在争夺一个更高价值的位置:不是回答一个问题,而是保存用户如何做事。
callout
用户只需向Grok传授一次特定任务的操作方法,Grok就能在后续的所有独立对话中永久记住相关的个人偏好、排版格式规则或特定工作流步骤
问题不在于 Grok 终于有了 memory。
问题在于 xAI 试图把 memory 产品化成 Skills,把“偏好”升级成“可调用的习惯”。
02 这事的真正含义
如果只把这条新闻理解成“Grok 跟进了 ChatGPT/Claude 的记忆能力”,那就看浅了。
真正重要的是,Skills 改写了 prompt 的归属关系。
过去,很多高频 AI 用户的核心资产并不在模型本身,而在自己手里那套 prompt stack:写周报的格式、代码审查的规则、投研摘要的结构、客服回复的话术、销售外联的约束。这些资产一直以非常原始的形式存在:notion 文档、snippet、脚本、固定开场白、MCP 工具配置。
而 Skills 的意义,是把这些零散资产吸进模型产品内部,变成平台托管的行为模板。
这才是 xAI 在说的事。
一旦用户的工作流被沉淀为 Skills,聊天产品就不再只是 token 消耗入口,而更像一个轻量 agent workspace。用户每开一次新对话,都不是从零开始,而是在调用一个长期存在的“自己训练过的 Grok”。
这会带来三个结构性变化。
第一,prompt 价值从一次性 token 消费,迁移到长期留存资产。
第二,用户迁移成本上升。因为你迁移的不只是聊天记录,而是几十个已经调好的 task behavior。
第三,前端产品的重要性重新上升。模型能力可以 API 化,但 Skills 这种用户行为层资产,更容易沉淀在消费入口而不是底层模型。
我可能误判的一点是:如果 Skills 只是表层文本注入,没有稳定的调用机制、版本控制和工具执行绑定,那它的上限会比较低,只是“记忆增强的 prompt preset”。但即便如此,它仍然说明一个方向:AI 产品竞争正从 model IQ,转向 workflow capture。
对 token economics 也有影响。
用户把重复性的长 prompt 压缩成 Skills 后,表面上会减少前置输入 token,提升体验;但平台反而可能因此获得更多高频调用,因为用户更愿意把更多细碎任务交给系统。单次请求变短,不等于总体 token 变少。很多时候,摩擦下降会带来更高总量消费,这和 cloud 降价后 compute 使用量上升是一个逻辑。
那个真正会被定价的,不是“记忆”本身,而是把重复劳动打包成默认能力之后的调用频次。
03 历史类比 / 结构对照
这件事更像 2014 年后 AWS 从卖裸 compute,逐步转向托管数据库、消息队列、serverless 的过程。
早期云计算卖的是基础资源:CPU、存储、网络。
后来价值上移,云厂商开始吞掉开发者原本自己维护的 operational knowledge。你不再关心怎么部署 Redis 集群、怎么容灾、怎么扩缩容,因为平台把复杂性封装掉了。结果不是开发者花得更少,而是更依赖云,更难迁移。
Skills 对 chat 产品的作用,和托管云服务对 compute 的作用相似。
它把“如何把模型用顺手”的 know-how,从用户侧脚本和提示词,转移到平台托管层。
还有一个更近的类比是 2022 年 ChatGPT 相对 Playground 式调用的胜利。
当时很多人以为差异只是 UI 更友好。其实不是。真正的变化是,ChatGPT 把模型使用从“需要会调参数”的 API 体验,变成“任何人都能形成习惯”的消费级入口。入口一旦形成,后续 plugin、memory、projects、agent 就有了承载体。
xAI 现在做的,是同一条路线的后半段:先占入口,再沉淀用户工作流。
这也是为什么 Skills 值得看,而不只是一个 feature update。
我没看到 xAI 公布 retention、DAU 或 Skills 使用率,所以还不能说它已经证明了产品市场匹配。但结构上,它踩中的方向是对的:AI 助手的下一轮竞争,不是单次回答更聪明,而是谁先把用户反复做的事编译成平台内资产。
04 对 AI builder 意味着什么
如果我今天是 AI builder,看到这条消息,调整不该停留在“要不要加记忆”。
更实际的问题是:你的产品里,哪些高频 prompt 应该被升级成 first-class object。
这周就该做三件事。
第一,盘点用户重复输入的前置 prompt。
不是所有 prompt 都值得产品化。优先看三类:格式规则稳定、任务边界清晰、跨 session 高频复用。比如固定风格写作、代码 review checklist、销售邮件模板、研究摘要结构。这些都适合从自由文本升级成 Skills、Templates、Profiles、Playbooks 之类的对象。
第二,重新评估 moat 在哪。
如果你的应用层价值主要来自一组 prompt engineering,那么平台把 prompt 持久化之后,你的差异化可能正在被上游吞掉。尤其是那些“帮用户写更好的 prompt”的产品,会最先感受到压力。问题不在模型变强,而在主入口开始原生支持 workflow persistence。
第三,考虑 model routing 与 memory store 的解耦。
对 API 消费者来说,最危险的做法是把用户偏好、任务配置和单一模型深度绑定。更稳的设计是:把 Skills 存在你自己的抽象层,底下再路由到 OpenAI、Anthropic、Google、xAI 或开源模型。这样上游再怎么打 memory feature,你仍保留切换空间。
我可能低估了一个现实:很多团队即便知道要做这件事,也未必能在 UX 上做好。因为 Skills 不是简单加一个“保存为模板”按钮,它要求任务定义、调用触发、编辑反馈、失败纠正形成闭环。这是产品工程,不只是模型接入。
对独立开发者还有一个直接含义:卖“prompt”越来越难,卖“workflow”还来得及。
prompt 是可复制的,workflow 更接近 operational software。
如果你的产品不能沉淀用户行为,那你最终只是替模型前端导流。
05 反方观点 / 风险
我前面的判断,成立的前提是 Skills 真能稳定工作,而且用户愿意持续维护。
反方其实很强。
第一种可能,是 Skills 被高估了。
很多所谓“持久记忆”最后都退化成脆弱的 context 注入:记错、漏掉、误触发、难删除。一旦错误记忆污染输出,用户会迅速失去信任。我没亲手测试 Grok Skills,所以不能确认它是否解决了 memory consistency 这个老问题。
第二种可能,是用户根本不想“教”模型。
AI 圈常有一个误区:认为用户愿意花很多时间配置 agent。现实往往相反。大多数人希望立刻得到结果,不愿维护复杂的个人自动化体系。Skills 如果设置成本高,就会沦为少数 power users 的玩具,而不是大众行为。
第三种可能,是平台级记忆未必构成真正 moat。
因为一旦用户意识到自己的 workflow 很重要,他们反而会要求导出、同步、跨模型复用。那时价值可能从单一聊天产品回流到中间层:MCP、agent profile store、workspace orchestration、team memory infra。这会削弱 xAI 这类前端产品的锁定效应。
第四种可能,是上游同质化速度极快。
OpenAI、Anthropic、Google 都已经在 memory、projects、custom GPTs、artifacts、workspace 方向布局。xAI 这次即便方向正确,也不代表它有 distribution 优势。功能拐点不等于市场拐点。
所以我不会把 Skills 定义成决定行业格局的大事件。
但我会把它视为一个清晰信号:主流 AI 助手正在从“回答问题的模型 UI”,转成“保存并复用用户工作方式的软件层”。
如果这个判断对,那么接下来真正激烈的战争,不是 benchmark 第一名。
而是谁先拥有用户的默认 workflow。