01 触发事件
2025 年,上海电信宣布面向本地用户推出 Token 算力服务:1 元对应 25 万额度点,支持按量购买、批量折扣、并可直接用话费账单支付;用户通过标准 API 接口可调用 30 余款主流大模型,报道举例是 KiMi-K2.5,10 元约可买 250 万额度点。
这里最重要的原始事实,不是“又一家卖 AI 的公司出现了”,而是运营商第一次把 Token 明确做成资费产品。
独立看,这个价格未必足以说明底层推理成本已经被打到什么水平,因为“额度点”和实际模型、输入输出、上下文长度、是否带缓存之间的映射还不透明,我没在内部跑过它的 billing rule,也可能低估了其中的条件限制。
但仅凭公开信息,已经足够确认一件事:Token 正在从开发者世界里的 API 计费单位,变成普通企业采购和个人支付体系可理解、可报销、可走账单的标准商品。
callout
上海电信把 Token 算力服务做成了运营商资费,1 元对应 25 万额度点,支持话费账单支付,并通过标准 API 调用 30 余款主流大模型。
02 这事的真正含义
这事真正有意思的地方,不在“上海电信也要做 AI”,而在distribution 开始吃掉 model abstraction layer。
过去一年,很多人把 AI API 生意理解成三层:上游模型厂商,中间聚合网关,下游应用开发者。
这个结构还成立,但上海电信的动作提示了第四层竞争:谁拥有现成的账单关系、企业销售网络和本地政企信任,谁就可能把 model access 包进自己原有的流量分发系统里。
这才是这条新闻在说的事。
运营商不是最会做模型的人,也不是最会做 developer experience 的人。问题不在模型能力,而在结算权和触达权。
对不少轻量级 API 用户,尤其是还没形成正式云采购流程的小团队、脚本开发者、传统企业 IT 部门,真正的 friction 从来不是“不会调 API”,而是:
- 采购云 credits 很麻烦
- 需要对公流程
- 多家模型商分别签约
- 月底对账复杂
- 财务不理解 Token 是什么
上海电信把这个问题暴力简化了:像买通信服务一样买 Token。
这意味着什么?
意味着 Token 正在被重新定义为一种可被渠道商重新打包的标准化 capacity,而不是只能由 OpenAI、Anthropic、Google、Moonshot、阿里云百炼、火山方舟这类原厂或云厂直接出售的原生产品。
如果这个模式成立,未来真正会被定价的,不只是模型本身,而是:
- 账单整合能力
- 本地销售能力
- 默认入口
- 合规背书
- 多模型 routing 的封装能力
换句话说,模型 API 这门生意会越来越像云分销,而没那么像纯 SaaS。
我可能会误判的一点是,上海电信这次也许只是区域性试水,SKU 设计和模型深度不够,不一定能形成持续 usage。但即使这样,信号已经足够清楚:Token 正在脱离“AI 原厂直营”的单一路径。
03 历史类比 / 结构对照
我想到的历史类比,不是 2022 年 ChatGPT,而更像 2014 年后 AWS 被大规模 channel 化的前夜。
早期云计算的叙事是:开发者绕过传统 IT 采购,直接刷卡上云。
这是真的。
但当云走向主流企业市场,决定增量的并不是 API 文档,而是:
- 谁能进企业采购名单
- 谁能提供统一账单
- 谁能做本地服务
- 谁能把复杂产品抽象成企业容易买的套餐
于是,云没有消灭渠道,反而催生了新的渠道层。
今天的 Token 也在走类似路径。
第一阶段,模型厂商教育开发者什么是 prompt、completion、context window、KV cache、tool calling。
第二阶段,聚合平台教育市场什么是 model routing、fallback、成本优化、多供应商冗余。
第三阶段,也就是现在露头的阶段,运营商、云厂商、软件分销商开始把 Token 变成可嵌入自身账单与销售体系的通用算力单位。
这个结构变化有点像 iPhone 之后运营商从“卖分钟数”转向“卖数据流量”。当底层供给变成标准化 packet,真正决定价值捕获的不是每个 packet 来自哪个 app,而是谁控制套餐、入口和结算。
当然,这个类比不能推得太远。AI Token 不像流量那样完全同质化,不同模型在质量、延迟、工具调用、长上下文稳定性上差异巨大。我没法仅凭这条新闻断言 Token 会完全 commodity 化。
但方向已经出现:至少对一部分低门槛需求,渠道商会努力把 Token 叙事做成 commodity。
而一旦 commodity 叙事成立,原厂的 moat 就必须回到两个地方:
- 极强的 frontier performance
- 深度集成的开发者生态与专有工作流
中间那层“我也有 API、我也能卖 Token”的玩家,会先被压价。
04 对 AI builder 意味着什么
对 AI builder,这不是一条可以转发完就算的行业新闻,而是这个月就该调整的几个判断。
第一,别再把 billing 只理解成支付功能。
billing 是 distribution。
如果运营商都开始卖 Token,说明未来获取开发者和中小企业客户的路径,会从“官网注册拿 API key”扩展到“从已有通信/云/办公软件供应商处采购 AI 额度”。
这会直接影响获客策略。
如果你卖的是 AI 应用或 Agent 平台,应该马上问自己:
- 你的产品能不能接受外部 Token credits 注入?
- 能不能支持多供应商 model routing?
- 能不能把 usage 明细回传给渠道侧账单系统?
- 如果客户不是买你的 SaaS,而是先买某个渠道的 AI 额度,你还能不能接住?
第二,多模型抽象层的价值在上升,但会更薄。
上海电信公开说可调 30 余款主流大模型。这说明它大概率不是在做单模型销售,而是在卖一个抽象后的 access layer。
这对网关、聚合器、API 平台是机会,也是警报。
机会在于,市场正在教育更多人接受“一个入口接多个模型”这件事。
警报在于,单纯靠“我能接很多模型”不再稀缺,渠道商也会做。
真正还能收费的能力,要更偏 execution:
- 成本最优 routing
- SLA 与 failover
- prompt caching 策略
- 细粒度权限管理
- usage observability
- 不同模型在具体任务上的策略编排
第三,低 ARPU 长尾用户可能被重新激活。
支持话费账单支付,这个细节很关键。
它降低的不是单次 Token 价格,而是支付摩擦。很多低频用户不是不需要 AI,而是不值得走一遍正式采购流程。现在只要手机账单能付,这部分需求会变成真实流量。
对开发者工具、自动化脚本产品、小型 Agent 服务,这可能打开一个新市场:不是更大的客户,而是更容易转化的客户。
第四,你该重新审视自己的定价单位。
如果上游开始用“额度点”而不是直接展示每百万 input/output token 单价,说明市场会出现两套语言:
- 开发者语言:token, context, latency, cache hit rate
- 渠道语言:额度包, 套餐, 账单, 折扣
谁能在这两套语言之间翻译,谁就更接近交易闭环。
我可能高估了短期影响,因为区域运营商产品未必能快速扩展到全国,更未必能吸引高质量开发者流量。但对任何卖 AI access 的公司,这已经是该做渠道兼容设计的时候,而不是继续假设所有客户都会直接来官网刷卡。
05 反方观点 / 风险
最强的反方观点是:这可能只是一次营销包装,而不是行业拐点。
原因很简单。
第一,“1 元 25 万额度点”看起来便宜,但报道只以 KiMi-K2.5 输入 Token 举例,没有讲清楚:
- output token 怎么计
- 多模态怎么计
- 长上下文是否额外收费
- tool use 是否单独计费
- 不同模型之间倍率是否差异巨大
如果这些规则复杂,所谓“套餐化”就只是表面简单,实际使用仍然会让开发者困惑。
第二,30 余款模型接入听起来很多,但模型数量不等于可用性。真正决定 builder 是否迁移的是:
- 延迟是否稳定
- 版本更新是否及时
- 文档是否完整
- SDK 是否顺手
- 错误码和 observability 是否够好
在这些维度上,运营商未必比专业 AI API 平台强。我没用过这套接口,不能替它背书。
第三,运营商渠道擅长卖标准化套餐,但 AI 需求未必足够标准化。高价值客户最终看的是任务成功率,不是额度包便宜几块钱。只要模型差异持续存在,Token 就很难像短信或流量那样完全 commodity 化。
第四,这种模式可能挤压的是尾部聚合商,不一定动到头部原厂。OpenAI、Anthropic、Google 真正的护城河仍在 frontier model 和生态控制权,而不是账单入口本身。
所以,我不认为“电信卖 Token”会立刻改写行业格局。
但我也不认为这只是无关痛痒的小新闻。
更准确的说法是:它是一个早期信号,表明 model access 的竞争,正从模型能力竞争扩展到渠道、结算和默认入口竞争。
一旦更多云厂商、运营商、企业软件平台都开始售卖标准化 Token credits,AI 行业会进入一个更像 cloud distribution 的阶段。
到那时,真正危险的不是模型不够强,而是你的产品仍然假设客户会主动来找你买 API。