Article Not Found

01 触发事件

Lenny's Newsletter 最近采访了前 OpenAI、Meta、Apple 硬件负责人 Caitlin Kalinowski。最值得注意的不是她谈了 VR、机器人或者 Steve Jobs，而是一个非常具体的判断：她正在建议 startup 提前预购 memory，因为接下来可能出现 memory price shock。

这不是泛泛而谈的“AI 会带动硬件需求”。

这是一个来自做过 MacBook、Quest、Rift、Orion、并在 OpenAI 从零搭过 robotics 与 hardware 团队的人，对上游约束的直接预警。

原文还把几个线索放在一起：VR 技术如何外溢到现代战争、humanoid robot 为什么仍停留在 prototype、以及她为什么认为 AI hardware boom 甚至还没真正开始。

我没法验证她手上具体拿到的供应链报价单，也没在内部跑过 memory 采购模型；但仅从她的履历和她强调的问题看，这不是消费电子从业者的怀旧发言，而更像一线 builder 在提醒市场：AI 现在最容易被低估的，不是 model quality，而是 physical deployment constraints。

Caitlin Kalinowski 正在建议 startup pre-buy memory，因为她预期会有 memory price shock

如果这个判断成立，受影响的不只是机器人公司。

凡是要把 AI 从 API 调用推进到 edge device、sensor fusion、on-device inference、或者带 persistent context 的专用设备，都会被同一条成本曲线重新定价。

02 这事的真正含义

表面上看，这是“硬件老兵看好 AI 硬件”。

真正的含义是：AI 行业的瓶颈正在从 training scarcity，部分转向 deployment scarcity。

过去两年，行业叙事中心是 GPU。谁拿到更多 H100、B200、TPU v5p，谁就更可能训练出更强的 frontier model。这当然仍成立。但 builder 视角下，更具体的问题已经变成：模型能力是不是能以可接受的 BOM、功耗、散热、memory footprint 和维修体系被部署出去。

问题不在模型能不能回答问题，而在模型能不能被装进一个真实可交付的系统里。

这尤其重要，因为 AI 应用已经开始从 chat interface 走向 agent、robotics、vision、ambient computing。到了这一步，token 成本不再是唯一核心变量。你还得处理：

memory 容量和价格
sensor stack 成本
edge compute 功耗
latency 与网络依赖
供应链交付周期
维修与售后体系

我可能会误判的一点是，memory price shock 未必会广泛持续，也可能只是某些高带宽、高可靠性规格先紧张，而不是整个市场同步上行。但哪怕只是局部 SKU 紧张，对创业公司也足够致命，因为小公司没有采购议价权，也没有替代器件认证能力。

这里有个更深一层的战略问题：AI 软件世界习惯了 elastic scaling，硬件世界没有这么仁慈。

API 流量涨了，你可以切 model routing、做 prompt caching、用 batch API、压缩 context。硬件缺货时，你不能靠 prompt engineering 解决。你要么提前锁单，要么改设计，要么延后出货。软件的敏捷性，会在硬件面前突然失效。

这才是 Caitlin 这类人的价值：她看到的是“从 demo 到 shipment”之间那条最容易把公司拖死的鸿沟。

对 OPCX.AI 这样的 token gateway 视角来说，这也提示一个趋势：未来一部分 AI 价值会从“调用哪个 model”迁移到“哪个系统更能承受不稳定的硬件供给”。换句话说，真正会被定价的，不只是 intelligence per token，还包括 reliable intelligence per deployed unit。

03 历史类比 / 结构对照

这件事最像的，不是 2022 年 ChatGPT。

更像 2007 年 iPhone 之后的那几年，或者 2014 年 AWS 真正进入企业主流前夜。

为什么。

2007 年之后，真正胜出的不是“最先看到智能手机机会”的公司，而是能把 SoC、battery、display、camera module、OS、developer ecosystem 组织成一个可大规模交付产品的公司。智能手机革命表面是软件平台革命，底层其实是供应链与硬件集成革命。

AI 现在也在进入类似阶段。

前两年行业主要看谁先把 model 做出来。接下来更像智能手机时代中盘：谁能把 model、memory、sensor、inference chip、cloud sync、tooling、distribution 拼成一个可靠系统，谁才有 moat。

另一组更贴切的类比是 AWS。

早期企业不想自己买服务器，并不只是 CapEx 问题，而是不想管理硬件复杂性。AWS 赢，不只是因为算力便宜，而是把底层供给不确定性抽象掉了。今天 AI infra 的下一个机会，也许不是再做一个“更聪明的模型入口”，而是把多模型、多硬件、多部署环境的复杂性抽象掉。

我没在机器人公司内部看过完整 unit economics，所以这点可能偏激；但如果 humanoid、home robot、industrial vision agent 真进入商用推进期，最大的赢家未必是最早发 demo 的整机厂，而可能是能控制 memory、compute module、firmware、云端 orchestration 的系统层玩家。

原文还提到 VR 技术如何成为现代战争的基础，这个信号也不该忽视。

这说明 AI hardware 的外溢路径，不会按消费级叙事走。很多技术先在小众、高价值、强预算场景成熟，再下沉到更大市场。就像早期 GPU 先由 gaming 驱动，后来喂大了深度学习；VR/AR 的 tracking、sensor fusion、低延迟计算，也可能先在 defense 和 industrial system 里放量，而不是先靠 consumer 爆发。

也就是说，AI hardware boom 不一定先长成“下一个 iPhone”，它可能先长成“下一个 Anduril + cloud-managed device fleet”。

04 对 AI builder 意味着什么

如果我今天在做 AI 产品，这件事会直接改变接下来一个月的几类决策。

第一，重新区分“纯 API 应用”和“依赖物理部署的 AI 应用”。

如果你的产品只跑在 browser 或 SaaS 层，短期核心仍然是 token economics：选更便宜模型、做 caching、做 routing、控制 latency。但如果你在做 voice device、edge agent、工业视觉、机器人、车载、可穿戴，接下来最该盯的不是 benchmark 榜单，而是 memory、module availability、功耗和交期。

第二，把 hardware dependency 写进产品路线图，而不是留给采购团队收尾。

很多团队会把硬件约束当 execution issue。这个判断在 AI hardware 周期里是错的。它是战略问题。你是否依赖某种 memory 规格、是否要求本地 70B 级模型、是否需要 always-on vision，这些设计一开始就决定了你的 burn、毛利和可交付性。

第三，尽量让架构保留 model/hardware 可替换性。

我没法保证未来 12 个月 memory 价格一定大涨，但 supply chain 波动几乎是确定的。builder 应该为此设计冗余：支持 cloud-edge hybrid、模型蒸馏、不同 quantization 路径、可切换供应商的 compute module。软件团队熟悉 multi-provider routing，硬件团队也得有类似思维。

第四，重新理解 moat。

在 web SaaS 时代，很多 moat 来自 distribution 和 switching cost。在 AI hardware 时代，这两者仍然重要，但会叠加一个旧世界变量：integration competence。你是否能把模型、设备、云端、售后、数据闭环接起来。这种能力不 glamorous，却非常难复制。

第五，如果你是 model API 消费者，也别觉得这和你无关。

硬件价格与供给变化，最后会回传到云端推理。memory 紧张不只影响机器人，也影响 inference server 的成本结构，尤其是长 context、KV cache 重、吞吐敏感的 workload。某些模型即便 token list price 没变，真实可用成本也可能因硬件侧压力而变化。

这才是 builder 本月该做的事：

审视产品是否真的需要 device 端 intelligence
把 memory footprint 纳入 PRD，而不只是工程优化项
对依赖硬件的产品，提前锁定关键器件与替代路线
对云端应用，准备好 model routing 和成本回传机制
不要把“能跑 demo”误判成“能 scale”

05 反方观点 / 风险

我可能错在三个地方。

第一，这次所谓 AI hardware boom，可能被讲得太早了。

硬件行业最擅长制造“下一个平台”叙事，但真实放量常常比市场预期慢很多。humanoid robot 到今天仍是 prototype，这本身就是提醒：技术可行不等于商业可行。很多公司会死在 reliability、service cost、safety certification，而不是死在 model intelligence。

第二，memory price shock 不一定转化成广泛行业机会。

它也可能只是一次典型的上游涨价周期，伤害创业公司，却让 incumbents 更强。大厂有采购合同、有库存策略、有自研芯片和云资源，小团队只能被动接受。这种情况下，所谓 hardware boom 不是创业窗口，而是集中度继续上升。

第三，AI hardware 未必能像 smartphone 那样形成巨大独立平台。

这一点我尤其不敢说得太满。很多所谓 AI device，最终可能只是 smartphone、PC、car、factory equipment 的 feature，而不是新物种。若是这样，独立创业公司可捕获的价值会很薄，绝大部分利润仍留在 Apple、Google、Meta、Tesla、Amazon 这类已有 distribution 的系统公司手里。

还有一个更尖锐的反驳：也许真正的赢家根本不是硬件公司，而是把 hardware complexity 吃掉的 infra 层。

如果模型持续变强、成本继续下行，很多原本想 on-device 做的事，会重新回到 cloud。builder 最后买的不是设备，而是可靠的 AI service。那样的话，hardware boom 的受益者会更像 Nvidia、memory 厂、cloud provider 和少数整机巨头，而不是一波新创业公司。

所以我的主判断不是“现在该 all in AI hardware 创业”。

我的判断更窄，也更重要：AI 行业开始重新受制于硬件约束，这会改变应用层的定价逻辑、交付节奏与竞争壁垒。

这才是这篇采访真正值得读的地方。不是因为她说了 AI 很大，而是因为她提醒了一件市场最容易忘掉的事：软件可以瞬间复制，硬件不行。

AI hardware boom 才刚开始

01 触发事件

02 这事的真正含义

03 历史类比 / 结构对照

04 对 AI builder 意味着什么

05 反方观点 / 风险

Related Reading

Byt eDance Doubles Down on Infrastructure , Not Models

Cerebras Price H ike: More Than Just IPO Momentum

CoreWeave Is No Longer Just a GPU Landlord

Genesis AI Isn 't Selling Models , It's Selling Closed Loops

CoreWeave's Drop Isn't About Performance— It's About Capacity Discipline

Sony and TSMC Bet on Sensors : Edge Perception Repr icing in the AI Era