01 触发事件

Lenny's Newsletter 最近采访了前 OpenAI、Meta、Apple 硬件负责人 Caitlin Kalinowski。最值得注意的不是她谈了 VR、机器人或者 Steve Jobs,而是一个非常具体的判断:她正在建议 startup 提前预购 memory,因为接下来可能出现 memory price shock。

这不是泛泛而谈的“AI 会带动硬件需求”。

这是一个来自做过 MacBook、Quest、Rift、Orion、并在 OpenAI 从零搭过 robotics 与 hardware 团队的人,对上游约束的直接预警。

原文还把几个线索放在一起:VR 技术如何外溢到现代战争、humanoid robot 为什么仍停留在 prototype、以及她为什么认为 AI hardware boom 甚至还没真正开始。

我没法验证她手上具体拿到的供应链报价单,也没在内部跑过 memory 采购模型;但仅从她的履历和她强调的问题看,这不是消费电子从业者的怀旧发言,而更像一线 builder 在提醒市场:AI 现在最容易被低估的,不是 model quality,而是 physical deployment constraints。

Caitlin Kalinowski 正在建议 startup pre-buy memory,因为她预期会有 memory price shock

如果这个判断成立,受影响的不只是机器人公司。

凡是要把 AI 从 API 调用推进到 edge device、sensor fusion、on-device inference、或者带 persistent context 的专用设备,都会被同一条成本曲线重新定价。

02 这事的真正含义

表面上看,这是“硬件老兵看好 AI 硬件”。

真正的含义是:AI 行业的瓶颈正在从 training scarcity,部分转向 deployment scarcity。

过去两年,行业叙事中心是 GPU。谁拿到更多 H100、B200、TPU v5p,谁就更可能训练出更强的 frontier model。这当然仍成立。但 builder 视角下,更具体的问题已经变成:模型能力是不是能以可接受的 BOM、功耗、散热、memory footprint 和维修体系被部署出去。

问题不在模型能不能回答问题,而在模型能不能被装进一个真实可交付的系统里。

这尤其重要,因为 AI 应用已经开始从 chat interface 走向 agent、robotics、vision、ambient computing。到了这一步,token 成本不再是唯一核心变量。你还得处理:

  • memory 容量和价格
  • sensor stack 成本
  • edge compute 功耗
  • latency 与网络依赖
  • 供应链交付周期
  • 维修与售后体系

我可能会误判的一点是,memory price shock 未必会广泛持续,也可能只是某些高带宽、高可靠性规格先紧张,而不是整个市场同步上行。但哪怕只是局部 SKU 紧张,对创业公司也足够致命,因为小公司没有采购议价权,也没有替代器件认证能力。

这里有个更深一层的战略问题:AI 软件世界习惯了 elastic scaling,硬件世界没有这么仁慈。

API 流量涨了,你可以切 model routing、做 prompt caching、用 batch API、压缩 context。硬件缺货时,你不能靠 prompt engineering 解决。你要么提前锁单,要么改设计,要么延后出货。软件的敏捷性,会在硬件面前突然失效。

这才是 Caitlin 这类人的价值:她看到的是“从 demo 到 shipment”之间那条最容易把公司拖死的鸿沟。

对 OPCX.AI 这样的 token gateway 视角来说,这也提示一个趋势:未来一部分 AI 价值会从“调用哪个 model”迁移到“哪个系统更能承受不稳定的硬件供给”。换句话说,真正会被定价的,不只是 intelligence per token,还包括 reliable intelligence per deployed unit

03 历史类比 / 结构对照

这件事最像的,不是 2022 年 ChatGPT。

更像 2007 年 iPhone 之后的那几年,或者 2014 年 AWS 真正进入企业主流前夜。

为什么。

2007 年之后,真正胜出的不是“最先看到智能手机机会”的公司,而是能把 SoC、battery、display、camera module、OS、developer ecosystem 组织成一个可大规模交付产品的公司。智能手机革命表面是软件平台革命,底层其实是供应链与硬件集成革命。

AI 现在也在进入类似阶段。

前两年行业主要看谁先把 model 做出来。接下来更像智能手机时代中盘:谁能把 model、memory、sensor、inference chip、cloud sync、tooling、distribution 拼成一个可靠系统,谁才有 moat。

另一组更贴切的类比是 AWS。

早期企业不想自己买服务器,并不只是 CapEx 问题,而是不想管理硬件复杂性。AWS 赢,不只是因为算力便宜,而是把底层供给不确定性抽象掉了。今天 AI infra 的下一个机会,也许不是再做一个“更聪明的模型入口”,而是把多模型、多硬件、多部署环境的复杂性抽象掉。

我没在机器人公司内部看过完整 unit economics,所以这点可能偏激;但如果 humanoid、home robot、industrial vision agent 真进入商用推进期,最大的赢家未必是最早发 demo 的整机厂,而可能是能控制 memory、compute module、firmware、云端 orchestration 的系统层玩家。

原文还提到 VR 技术如何成为现代战争的基础,这个信号也不该忽视。

这说明 AI hardware 的外溢路径,不会按消费级叙事走。很多技术先在小众、高价值、强预算场景成熟,再下沉到更大市场。就像早期 GPU 先由 gaming 驱动,后来喂大了深度学习;VR/AR 的 tracking、sensor fusion、低延迟计算,也可能先在 defense 和 industrial system 里放量,而不是先靠 consumer 爆发。

也就是说,AI hardware boom 不一定先长成“下一个 iPhone”,它可能先长成“下一个 Anduril + cloud-managed device fleet”。

04 对 AI builder 意味着什么

如果我今天在做 AI 产品,这件事会直接改变接下来一个月的几类决策。

第一,重新区分“纯 API 应用”和“依赖物理部署的 AI 应用”。

如果你的产品只跑在 browser 或 SaaS 层,短期核心仍然是 token economics:选更便宜模型、做 caching、做 routing、控制 latency。但如果你在做 voice device、edge agent、工业视觉、机器人、车载、可穿戴,接下来最该盯的不是 benchmark 榜单,而是 memory、module availability、功耗和交期。

第二,把 hardware dependency 写进产品路线图,而不是留给采购团队收尾。

很多团队会把硬件约束当 execution issue。这个判断在 AI hardware 周期里是错的。它是战略问题。你是否依赖某种 memory 规格、是否要求本地 70B 级模型、是否需要 always-on vision,这些设计一开始就决定了你的 burn、毛利和可交付性。

第三,尽量让架构保留 model/hardware 可替换性。

我没法保证未来 12 个月 memory 价格一定大涨,但 supply chain 波动几乎是确定的。builder 应该为此设计冗余:支持 cloud-edge hybrid、模型蒸馏、不同 quantization 路径、可切换供应商的 compute module。软件团队熟悉 multi-provider routing,硬件团队也得有类似思维。

第四,重新理解 moat。

在 web SaaS 时代,很多 moat 来自 distribution 和 switching cost。在 AI hardware 时代,这两者仍然重要,但会叠加一个旧世界变量:integration competence。你是否能把模型、设备、云端、售后、数据闭环接起来。这种能力不 glamorous,却非常难复制。

第五,如果你是 model API 消费者,也别觉得这和你无关。

硬件价格与供给变化,最后会回传到云端推理。memory 紧张不只影响机器人,也影响 inference server 的成本结构,尤其是长 context、KV cache 重、吞吐敏感的 workload。某些模型即便 token list price 没变,真实可用成本也可能因硬件侧压力而变化。

这才是 builder 本月该做的事:

  • 审视产品是否真的需要 device 端 intelligence
  • 把 memory footprint 纳入 PRD,而不只是工程优化项
  • 对依赖硬件的产品,提前锁定关键器件与替代路线
  • 对云端应用,准备好 model routing 和成本回传机制
  • 不要把“能跑 demo”误判成“能 scale”

05 反方观点 / 风险

我可能错在三个地方。

第一,这次所谓 AI hardware boom,可能被讲得太早了。

硬件行业最擅长制造“下一个平台”叙事,但真实放量常常比市场预期慢很多。humanoid robot 到今天仍是 prototype,这本身就是提醒:技术可行不等于商业可行。很多公司会死在 reliability、service cost、safety certification,而不是死在 model intelligence。

第二,memory price shock 不一定转化成广泛行业机会。

它也可能只是一次典型的上游涨价周期,伤害创业公司,却让 incumbents 更强。大厂有采购合同、有库存策略、有自研芯片和云资源,小团队只能被动接受。这种情况下,所谓 hardware boom 不是创业窗口,而是集中度继续上升。

第三,AI hardware 未必能像 smartphone 那样形成巨大独立平台。

这一点我尤其不敢说得太满。很多所谓 AI device,最终可能只是 smartphone、PC、car、factory equipment 的 feature,而不是新物种。若是这样,独立创业公司可捕获的价值会很薄,绝大部分利润仍留在 Apple、Google、Meta、Tesla、Amazon 这类已有 distribution 的系统公司手里。

还有一个更尖锐的反驳:也许真正的赢家根本不是硬件公司,而是把 hardware complexity 吃掉的 infra 层。

如果模型持续变强、成本继续下行,很多原本想 on-device 做的事,会重新回到 cloud。builder 最后买的不是设备,而是可靠的 AI service。那样的话,hardware boom 的受益者会更像 Nvidia、memory 厂、cloud provider 和少数整机巨头,而不是一波新创业公司。

所以我的主判断不是“现在该 all in AI hardware 创业”。

我的判断更窄,也更重要:AI 行业开始重新受制于硬件约束,这会改变应用层的定价逻辑、交付节奏与竞争壁垒。

这才是这篇采访真正值得读的地方。不是因为她说了 AI 很大,而是因为她提醒了一件市场最容易忘掉的事:软件可以瞬间复制,硬件不行。