## 01 触发事件 2026 年 5 月,ASML CEO Christophe Fouquet 在接受 TechCrunch 采访时给出了一句极强势的表态:No one is coming for us。 这句话表面上是在回应竞争问题,实际对象不是某一家芯片公司,而是整个先进制程设备链条里的潜在替代者。 我没看到这篇节选里有更多数字,也没在内部跑过 ASML 的产能模型,所以这里不能把它写成“ASML 新增了多少台 EUV”那种新闻。能确认的事实只有两个:第一,讲话者是 2024 年接任 CEO 的 Christophe Fouquet;第二,ASML 在 2026 年这个时间点公开表达了对自身竞争位置的极端自信。 这已经足够构成一个供给侧信号。 因为在 AI 产业里,真正稀缺的从来不只是模型能力,而是把模型能力大规模、稳定、低成本地变成 token 的那条链路。ASML 卡住的,就是那条链路最上游、最难复制的一环。 No one is coming for us 这句 callout 的价值,不在情绪,而在它把一个本来分散在 GPU、HBM、foundry、cloud capex 里的问题,重新压缩成一个更底层的判断:先进逻辑制程的扩产速度,依然受制于极少数设备能力。 ## 02 这事的真正含义 这事真正的含义,不是“ASML 很强”,而是 AI 供给曲线并没有因为模型竞争激烈就突然变得平滑。 过去两年,市场容易被应用层和 model leaderboard 带偏,仿佛 OpenAI、Anthropic、Google、xAI、Meta、DeepSeek 之间的竞赛,会自然推动算力供给像软件一样快速扩散。但半导体产业不是 SaaS。你不能靠多招一点工程师,就复制一条 EUV 设备体系。 ASML 的 moat 不是单点技术领先,而是 system-level monopoly:光源、镜头、精密运动控制、软件校准、供应链协同、客户工艺共优化,这些拼起来才是今天的 EUV。问题不在于“有没有人想挑战 ASML”,而在于“有没有人能在合理时间内复制整套工业能力”。 我可能在时间尺度上会误判,但至少在未来 3-5 年里,这个答案看起来仍然是否定的。 这会直接传导到 AI 基础设施的三个现实: 第一,GPU 价格战不会简单等于 inference 成本自由落体。 即便 model architecture 因为 MoE、MLA、KV cache 优化、编译器进步而继续压低单 token 成本,capex 的底层锚点仍然受先进制程供给约束。也就是说,软件带来的降本是真实的,但它无法完全抹平硬件供给稀缺带来的租值。 第二,cloud provider 的 AI 业务更像“配给体系”,而不只是卖算力。 如果最先进芯片的 upstream 产能扩张受限,那么 hyperscaler 真正售卖的不是纯算力,而是优先级、可预测性和交付确定性。这才是为什么 AWS、Google Cloud、Azure、Oracle 都在 aggressively 锁定长期供给。表面看是云竞争,内核是 scarce compute allocation。 第三,模型公司的战略会继续分化。 闭源 labs 会更倾向于把最强模型能力留在自己的高毛利产品和 API 层,因为 frontier training 和 serving 背后的基础设施约束并没有消失。开源阵营即便在权重发布上更积极,也仍然受限于谁能拿到足够多、足够便宜、足够稳定的推理资源。 这才是 ASML 这句话在说的事:AI 行业最重要的 bottleneck,还没有从 atom world 切换到 pure bits world。 ## 03 历史类比 / 结构对照 如果要找类比,我觉得这更像 2014 年前后的 AWS,而不是 2022 年 ChatGPT。 ChatGPT 的意义是需求侧爆发:它证明了自然语言接口能打开 mass-market curiosity,也证明了 transformer 规模化后产品体验会跨过一个阈值。 但 ASML 所处的位置,更像 AWS 在云计算早期建立的结构性优势,只不过 AWS 当年控制的是 elastic compute abstraction,ASML 控制的是制造先进 compute 的入口。 两者共同点在于:外界会低估 bottleneck owner 的议价权,因为用户看到的是上层产品,而不是下层 choke point。 差别也很明显。AWS 的 moat 虽深,但理论上可以通过巨额资本和长期建设被追赶;ASML 的难点则在于,它不是单纯资本密集,而是知识、工艺、供应链、客户验证和地缘政治共同叠加的复合 moat。 我没在半导体设备公司内部待过,所以这类比可能有偏差,但结构上它更接近“基础设施入口控制权”,而不是“某一代产品领先”。 还有一个更冷的类比是 2008 年金融危机后的流动性偏好。 当某个系统里最关键的资源变得稀缺时,资金、客户、合作伙伴会优先流向最确定的节点,而不是最有想象力的节点。今天 AI 产业里,最确定的节点之一就是先进制程能力。于是你看到资本追逐 GPU、HBM、power、datacenter,以及所有能把晶圆变成可用 token 的环节。 所以别把 ASML 的表态看成 CEO 个人自信发言。 它更像是 supply chain 中枢对全行业发出的定价信号:你们可以在应用层狂奔,但底层节奏仍然要经过我这里。 ## 04 对 AI builder 意味着什么 对 AI builder 来说,这周和这个月真正该调整的,不是去争论哪家 frontier model 在 benchmark 上又涨了几点,而是重新审视自己的 compute assumptions。 第一,别把长期 token 降价当作必然。 API 价格整体下行是大趋势,但这个趋势会是波动式而不是线性的。模型公司会通过 prompt caching、batch API、异步任务、context 分层、router 策略,把一部分成本下降让利出来;但当上游供给紧张、需求暴涨时,价格下降节奏会被打断。 如果你的产品 unit economics 建立在“6 个月后主流模型一定再便宜 70%”这种假设上,那风险很大。 第二,routing 要从“追最强模型”转向“追可替代性”。 真正的策略不是 all-in 某个 frontier API,而是让系统天然支持 model routing、多供应商 fallback、不同 latency/cost tier 的任务拆分。因为当供给约束存在时,最贵的不是 token 本身,而是你在单一模型上的 dependency。 这点对 opcx.ai 这种 token gateway 逻辑尤其关键:客户买的不是某个模型,而是跨模型 access 的 optionality。 第三,把 context 当预算,而不是默认福利。 大 context window 的确打开了很多 agentic workflow,但 context 不是免费的。底层推理成本、KV cache 占用、吞吐限制,都会反映到真实账单和服务波动上。我可能低估了未来硬件对长上下文的优化速度,但至少当前阶段,builder 应该更积极做 retrieval、memory compression、任务分段,而不是把所有问题都扔给超长 context。 第四,重新看 cloud 和 infra 合作对象。 如果先进算力供给继续偏紧,那么能够拿到稳定 capacity 的平台,其商业价值会上升。你不一定需要自己买 GPU,但你需要知道你的上游有没有真正的 capacity control,还是只是一个转售层。两者在平稳期差别不大,在资源紧张期差别极大。 第五,应用层 moat 要少建立在“我用了最新模型”。 因为最新模型能力迟早扩散,真正难扩散的是 distribution、workflow embedding、switching cost 和 proprietary data loop。底层算力约束越强,上层应用越应该围绕高价值任务去设计,而不是围绕炫技 demo 去堆 token。 ## 05 反方观点 / 风险 我最可能错的地方,是高估了 ASML 这个 choke point 对 AI 行业中期利润分配的决定性。 一种反方观点是:即便 ASML 在 EUV 上没有直接对手,AI 产业的价值捕获也未必继续向制造端倾斜。原因很简单,最终用户付费仍然发生在产品层,利润池可能被应用、agent 平台、企业 workflow 软件拿走,而不是被设备垄断者拿走。 这个反驳不弱。 另一个反方观点是,architecture innovation 可能比 supply constraint 变化更快。比如更高效的 MoE、更强的 sparse activation、更低 KV cache 压力、甚至新的 accelerator design,都可能显著降低对最先进制程 GPU 的依赖。若真如此,ASML 的控制点虽然仍存在,但其对 token 价格的传导可能会被削弱。 我没跑过这些前沿架构在大规模生产环境下的成本模型,所以这点我可能误判。 还有一种更直接的挑战来自地缘政治和产业政策。ASML 的优势越关键,越会被出口管制、国家资本和本土替代战略盯上。短期没人“coming for us”,不等于长期不会出现非市场化竞争者。半导体从来不是纯商业市场,它一直带着国家能力投影。 最后,也要警惕把“无对手”误读成“无风险”。 很多行业的 dominant supplier 不是死于正面竞争,而是死于需求结构变化。若未来 AI 训练范式、硬件范式或计算分布模式发生根本转向,今天围绕先进逻辑制程建立的权力结构也可能被重写。 但在那之前,我倾向于给一个更冷的判断:AI 行业眼下最值得敬畏的,不是又一条 benchmark 曲线,而是那些决定 benchmark 能否被大规模兑现的工业 bottleneck。 ASML 这句狠话,价值就在这里。它提醒市场,真正会被定价的,首先不是智能本身,而是智能背后的产能。