01 触发事件

2026 年 5 月,Bloomberg 报道 CME Group 正与 Silicon Data 合作,计划推出一个面向 computing powerfutures market

原始信息其实很短:美国最大的衍生品交易所之一 CME,要把“算力”做成可交易的期货合约;Silicon Data 提供相关 index 支撑;Bloomberg 的表述重点是“为什么现在做,以及这个市场将如何运作”。

这已经足够构成高分信号。

因为这里被金融化的,不是电力、天然气、小麦,也不是传统云厂商按月结算的 VM,而是更接近 AI training / inference 所依赖的有效算力供给。我没看到 Bloomberg 这条视频之外更完整的合约细则,所以合约到底锚定 GPU hours、某类 accelerator basket,还是某种 normalized computing index,这点我可能误判。但即便细节未公开,方向已经非常清楚:算力正在从资源,变成资产;从采购问题,变成风险管理问题。

这才是这条新闻在说的事。

CME Group and index provider Silicon Data are teaming up to create a futures market for computing power.

如果一个东西可以被标准化、指数化、远期交易,它就不再只是“紧缺资源”,而开始进入真正的价格发现机制。

对 AI 行业来说,这是个结构性变化。

02 这事的真正含义

表面上看,这是金融市场又多了一个新品类。

问题不在“多了一个新品类”,而在 AI 算力第一次开始尝试脱离具体机器、具体机房、具体云合同,被抽象成统一商品

过去两年,AI builder 面对算力有三个现实:

第一,供给不透明

OpenAI、Anthropic、Google、xAI、Meta 以及云厂商到底锁了多少 capacity,外部只能从 capex、交付周期、租赁合同和 API 稳定性去猜。所谓“算力价格”,很多时候不是公开市场价格,而是大客户通过预付、保底、长期 commit 拿到的私下价格。我没在内部跑过这些 procurement 流程,但行业里的人都知道,公开 list price 往往不是成交价。

第二,成本传导滞后

GPU 价格变了,不会立刻传导到 API token 定价。中间隔着模型架构、utilization、KV cache 命中率、batching、prompt caching、网络带宽、供电和折旧周期。所以今天 API 价格看似稳定,不代表底层成本稳定。相反,它可能意味着某些 lab 正在硬扛毛利。

第三,风险管理手段极弱

航空公司可以买燃油期货,芯片公司可以对冲汇率,数据中心可以锁电价,但 AI 公司、模型 API 消费者、算力 broker、甚至 cloud provider,在“未来 6-18 个月 compute 成本怎么走”这件事上,基本没有成熟对冲工具。你能做的只是多签几年合同,或者预留 capacity。这不是对冲,这是押注。

所以 CME 要做的事,本质上是在给 AI infra 补一层资本市场语言。

一旦算力 futures 成形,至少有三件事会发生。

其一,算力会出现更清晰的远期价格曲线。

今天很多人讨论 inference economics,还停留在“某模型每百万 token 多少钱”。但真正会被定价的,不是 token,而是 生成这些 token 背后的边际 compute。token 是应用层计费单位,不是基础层经济单位。尤其当不同模型采用 MoE、MLA、不同 attention 实现、不同 KV cache 策略后,同样 1M token 对底层资源的占用完全不等价。

有了 futures,市场会开始问:未来 3 个月、6 个月、12 个月,标准化算力的价格是 contango 还是 backwardation?这是云供给宽松还是紧张?这是训练需求在吸血,还是 inference 优化已经释放了 capacity?

其二,AI infra 的毛利会更像 trading business。

今天 token 网关、模型聚合层、推理服务商,很多人以为自己做的是 SaaS。实际上越来越像 低毛利、高周转、靠 routing 和 risk management 吃饭的中间层。如果底层算力价格波动可交易,那么上层 API 价格就不再只是产品经理定价,而会越来越像 hedge book 的结果。

这对 opcx.ai 这类 model access 平台尤其关键。

因为当底层模型价格、上下文长度、prompt caching 折扣、batch API 折扣都在变化时,真正的 moat 不是“接了多少模型”,而是 谁能把波动消化成稳定 SLA 和可预测报价。这点我可能说得偏绝对,但方向不会差太多。

其三,算力将从卖方市场叙事,进入买方市场博弈。

过去两年,GPU scarcity 让很多供应商天然占优。拿到卡就是 moat。可一旦期货市场建立,价格透明度提升,买方会获得新的谈判工具。即便合约本身初期流动性有限,它也会变成 reference price。就像石油现货合同离不开期货曲线一样,未来 AI compute 合同也会被“市场预期”锚定。

这会压缩一部分信息不对称红利。

03 历史类比 / 结构对照

我更愿意把这件事类比成 电力市场金融化,而不是单纯类比云计算。

AWS 在 2014 前后真正改变行业,不只是把服务器租出去,而是把计算能力拆成标准 SKU,让创业公司可以按需购买。那是 计算资源服务化

CME 这一步,如果能走通,则更接近 计算资源商品化 + 金融化

两者差别很大。

服务化解决的是 access problem:你能不能用上。

商品化解决的是 pricing problem:你愿意按什么价格长期承诺。

金融化解决的是 risk problem:当价格波动时,谁来承担。

这让我想到 2000 年代美国电力与天然气市场的演进。最初企业关心的是“有没有电”,然后关心“电价贵不贵”,再后来才是“我要不要锁未来价格、如何做 hedging、如何管理 peak load 风险”。AI 行业现在大概还处在第二阶段尾声,刚要进入第三阶段。

这也是一个典型的 Grove 式 inflection point:当关键生产资料从稀缺资产变成可对冲商品,行业竞争焦点会从占有资源,转向配置资源。

训练时代,核心是“谁先拿到更多 GPU”。

推理时代,核心会变成“谁能以最低波动、最低延迟、最低单位成本,把算力转化成稳定 token 输出”。

这也是为什么我认为这件事不是传统金融媒体里的边角料,而是 AI infra 的结构信号。

它甚至可能改变闭源与开源的相对力量。

闭源大模型公司今天的一个隐性优势,是它们能直接控制训练与推理 stack,拿到更低的实际 compute 成本。开源生态虽然模型权重开放,但在 deployment 侧经常受制于 infra 成本与运营复杂度。如果 compute futures 让价格更透明、采购更可预测,那么开源部署方的 planning 能力会增强,某些 hosted open-weight provider 可能因此受益。

当然,我没看到 CME 合约设计是否足够贴近 AI inference 真实 workload;如果指数设计过于粗糙,类比就会失效。这是当前最大的未知数之一。

04 对 AI builder 意味着什么

如果你是 AI builder,这周不需要去开户交易期货。

但这个信号要求你在这个月调整几件事。

第一,别再只盯 token 单价,开始建立自己的 compute exposure 视角。

今天不少团队比较模型,只看 input/output token 价格。这太浅。你应该至少把以下变量放进一张表:

  • 模型的长上下文成本曲线
  • prompt caching 命中率
  • batch API 可用性与折扣
  • 峰值时段 latency 漂移
  • 不同 provider 的 rate limit 稳定性
  • 自建或托管 open model 的单位请求成本区间

这不是财务洁癖,而是 survival issue。因为一旦底层算力定价进入金融化阶段,波动管理能力本身会成为产品能力

第二,model routing 会从优化技巧,升级成经营系统。

如果底层 compute price 有远期预期,路由逻辑就不只是“哪个模型便宜用哪个”,而是“在 SLA 不变前提下,把不同时间、不同 context 长度、不同任务类型分配到最有利的 capacity bucket”。

例如:

  • 短 prompt、高频请求,优先吃 caching 命中高的 provider
  • 长 context、低时延不敏感任务,转向 batch 或异步队列
  • 对质量弹性大的场景,引入 open-weight fallback
  • 对高毛利客户,锁更稳定但更贵的 closed model

这会让 API 网关层的价值上升。

不是所有 builder 都要自己做 routing engine,但所有有规模的团队都该拥有 provider abstraction,否则 switching cost 会反过来困住自己。

第三,重新看待 commit contract。

过去签 cloud commit,很多团队只考虑折扣。未来要考虑的是:你签下的是便宜,还是单边风险?如果 compute futures 提供公开价格锚,那么长期 commit 的优劣会更容易被看穿。此时真正稀缺的不是折扣本身,而是 在需求不确定时保留弹性

这点对 agent 产品尤其重要。因为 agent workload 的 token 消耗分布通常比 chatbot 更肥尾,峰值不可预测。你今天以为能跑通的 unit economics,可能被某个新模型、更长 context window、更多 tool calls 迅速击穿。

第四,应用层套利窗口会缩短。

过去一年,很多 AI 产品的毛利改善来自模型降价,而不是产品本身变强。这个阶段不会永久持续。一旦基础算力被市场更高频地发现价格,上游降价节奏可能更理性,纯吃“模型越来越便宜”的应用会被迫回到 retention、workflow depth、distribution 这些老问题。

这才是 builder 应该警惕的地方。

05 反方观点 / 风险

我最强的反对意见其实是:这个市场可能根本做不起来。

原因很直接。

第一,算力不够标准化

石油有等级差异,但仍可交易;算力的问题更复杂。NVIDIA H100、B200、某些 TPU、不同网络拓扑、显存容量、互联带宽、软件栈成熟度,对训练和推理价值都不一样。你很难定义一个既简洁又足够真实的 computing power index。我没见过 Silicon Data 的完整 methodology,如果指数过度抽象,合约就可能脱离实际需求。

第二,真实买方未必需要公开市场。

OpenAI、Google、Meta、Microsoft 这种级别的参与者,更可能通过长期 bilateral agreement 解决问题,而不是上交易所做标准化对冲。真正会用期货的,可能是二线 cloud、broker、infra fund、部分大企业买方。若核心现货玩家不参与,流动性会很薄,价格发现能力就弱。

第三,AI compute 的改进速度可能快过金融合约迭代。

今天你对冲的是某类 GPU 供给紧张,明天 MoE、KV cache、speculative decoding、更好的 compiler 或硬件替代方案就把单位任务所需 compute 打下来了。也就是说,被对冲的对象本身在快速变化。金融市场最怕标的漂移。

第四,如果供给最终极度宽松,算力期货的重要性会下降。

这是我判断里最值得警惕的一点。假如 2026-2027 年 GPU、TPU、ASIC 供给快速扩张,加上 inference optimization 持续推进,compute 变得像普通云资源那样充裕,那么 CME 这一步可能只是个象征事件,而非行业拐点。那时真正值钱的不是算力价格管理,而是 distribution 和应用留存。

所以我不认为“CME 入场”自动等于一个成熟新市场诞生。

但即便如此,这条新闻仍然重要。

因为它至少说明了一件事:金融市场已经把 AI compute 视为值得单独定价的生产资料。

当华尔街开始给某种资源设计 hedge 工具时,往往意味着这个资源已经足够大、足够波动、足够关键,值得被从工程问题升级为资产负债表问题。

这才是值得 AI builder 真正注意的信号。