OpenAI 要做的不是手机
## 01 触发事件
The Verge 8 月报道称,基于供应链分析师郭明錤的说法,OpenAI 正在“fast-tracking”一款 ChatGPT phone,目标是 2027 年初量产,芯片可能采用定制版 MediaTek Dimensity 9600,强调 image signal processor 与 enhanced HDR。
这条消息表面上像“OpenAI 也要下场做硬件”。
但如果把时间点、芯片选择和量产节奏放在一起看,我更愿意把它理解成另一件事:OpenAI 在测试自己是否能从 model company,迈向 default interface company。
我没在内部跑过这条供应链链路,所以对“最终是不是 phone 形态”这点保留怀疑。尤其在今天,所谓 phone、pin、companion device、camera wearable,边界本来就被故意说得模糊。
留意原始信号本身其实很具体:
MediaTek,而不是 Apple 自研或高通旗舰叙事。
2027 年初量产,而不是明年发布。
headline spec 是 ISP,而不是纯 NPU 算力。
这不是“再来一台更好的智能手机”的产品定义。
这更像一台为 multimodal agent 优化的感知终端。
OpenAI is reportedly “fast-tracking” the device and aiming to start mass production in early 2027
这句最重要的不是 fast-tracking,而是 mass production。那意味着这已经不是 Ive 式概念工业设计新闻,而是供应链、成本、良率、渠道、SKU 管理的问题了。
## 02 这事的真正含义
这事真正的含义,不在 OpenAI 发布了一个新硬件 rumor。
问题不在 device, 而在 distribution。
今天大模型公司的核心矛盾很清楚:模型能力越来越像 commodity,真正稀缺的是谁能占据用户发起请求的第一入口,以及谁能拿到持续、低摩擦、原生的上下文流。
ChatGPT 在移动端再强,依然受制于 iOS 和 Android 的 app distribution 规则。你可以有最强 reasoning,但你不是 lock screen,不是 camera button,不是默认拨号,不是通知层,不是后台常驻 agent。你更拿不到系统级 sensor graph。
如果 OpenAI 真做 phone,它押注的不是硬件毛利。
它押注的是把 ChatGPT 从“用户主动打开的 app”,变成“环境默认调用的 agent layer”。
这是完全不同的商业位置。
今天 API 层竞争,很多人还在盯 input token / output token 单价、context window、KV cache、batch discount。那些当然重要,但它们越来越像二级竞争。一级竞争已经变成:谁拥有 request origination。
谁先被调用,谁就更容易拿到上下文。
谁拿到上下文,谁就更容易提升 session retention。
谁能在 OS 级别常驻,谁就能把 model routing 权力抓回自己手里,而不是交给 Apple、Google 或第三方 app。
我可能误判的一点是,OpenAI 未必真的要做“完整手机公司”。也可能只是借 phone form factor 换取更深的 hardware/software integration,再通过 OEM 或运营商合作落地。因为自己做终端意味着售后、库存、渠道补贴、区域合规,这些都不是 OpenAI 过去擅长的战场。
但即便如此,战略方向仍然成立:OpenAI 想要的不是一台设备,而是默认入口。
还有一个容易被忽略的点:MediaTek 这类方案如果属实,说明 OpenAI 不一定追求苹果式垂直极致,而更像寻找足够好的成本曲线与可量产性。这种选择很“AI 公司”——先拿 distribution slot,再慢慢优化单点体验。
## 03 历史类比 / 结构对照
最像的历史对照,不是某家 app 公司出手机。
更像 2007 年 iPhone 对 mobile internet 的重定价。
iPhone 改变的不是“手机能不能上网”,而是把计算入口、交互方式、开发者分发、传感器调用和商业模式,一次性重写。之后真正占便宜的,不只是 Apple 硬件利润,而是 App Store 那个新的控制面。
OpenAI 如果真下场做 phone,也是在试图定义 AI-native computing 的控制面。
这和 2014 年 AWS 的逻辑也有一点相似。AWS 真正厉害的不是卖虚拟机,而是成为默认部署平面。等开发者工作流、权限模型、账单体系、监控体系都挂在 AWS 上,switching cost 才开始显现。OpenAI 现在的问题也是一样:单靠 model API,本身未必构成足够厚的 moat;但如果它控制了用户入口、agent runtime、identity、memory、tool invocation,那就不是一回事了。
所以这件事的结构对照其实很清楚:
上一阶段 AI 的核心资产是 intelligence。
下一阶段 AI 的核心资产可能是 invocation。
也就是,谁在什么上下文下,被默认叫出来做事。
这也是为什么“ISP enhanced HDR”这种规格并不无聊。它暗示设备可能重视持续视觉输入、环境理解、低延迟 multimodal capture。换句话说,这不是给人拍更好照片,而是给 agent 喂更好的世界状态。
我没法确认 OpenAI 是否能把这条链路打通,因为 camera-first agent device 过去并没有太多成功案例。Humane AI Pin 的失败已经证明,用户不会因为“AI 很未来”就接受更差的交互和更弱的可靠性。
但失败案例恰恰说明一件事:单独做新奇硬件没用,必须嵌进高频计算入口。手机仍然是那个入口。
## 04 对 AI builder 意味着什么
对 AI builder 来说,这周真正该调整的,不是去猜 OpenAI 这台设备长什么样。
而是重新审视自己的 distribution dependency。
如果你的产品今天 70% 以上价值建立在“用户主动打开 app,复制粘贴文本,请模型回答”,那你暴露在一个非常危险的位置:平台只要把 agent 做进系统层,你的流量入口就可能被吞掉。
这才是应该立刻做的几件事。
第一,尽量把产品能力做成可被 agent 调用的 service,而不只是 UI。
MCP、tool schema、structured outputs、可审计的 action layer,这些不只是工程整洁问题,而是未来被系统级 agent 接入的门票。我没在你们具体业务里跑过,所以不敢断言 MCP 一定是终局,但“可调用性优先”这个方向大概率没错。
第二,减少对单一前端分发的依赖。
如果你的核心资产不是 app DAU,而是某种 workflow、数据闭环、组织内嵌入流程,那么即便系统 agent 崛起,你也还有 survive 的空间。反过来,纯 wrapper 会更难。
第三,重估 multimodal 的优先级。
既然 rumor 指向 ISP 和视觉链路,那说明未来默认 agent 不会只处理 text prompt,而是持续读图、读屏、读环境。很多 builder 现在还把 multimodal 当 demo feature,我怀疑这是低估。真正会被定价的,是谁能把视觉上下文转成可靠 action。
第四,API 消费者要开始预演更激进的 model routing。
如果终端厂商和模型厂商一体化,顶层流量可能越来越向自家模型倾斜。届时第三方应用最合理的防守,不是押单一 frontier model,而是建立自己的 routing、fallback、缓存和成本控制层。opcx.ai 这类 token gateway 之所以有意义,也在这里:上游模型和下游入口都在变,独立的 access layer 反而变得更值钱。
第五,关注 hardware signal,但不要冲动做硬件。
除非你控制极强的特定 workflow,或者 device 本身就是必要 part of product,否则大多数 startup 不应该被“AI hardware”三个字诱导。我可能保守了,但现阶段绝大多数团队更该做的是嵌入现有设备,而不是发明新设备。
## 05 反方观点 / 风险
最强的反方观点其实很直接:这可能根本不重要。
第一种可能,这只是供应链 rumor,被过度放大。OpenAI 过去围绕硬件的传闻很多,但从 rumor 到 shipping product,中间隔着极高的不确定性。我没看到官方确认,所以把它当成既成事实会很危险。
第二种可能,即便 OpenAI 真的做 phone,也很难撼动 Apple 和 Google。智能手机不是一个“有更强 AI 就能赢”的市场。渠道、运营商、售后、工业设计、系统稳定性、应用生态,任何一项掉链子都足够致命。Humane、Rabbit 的教训已经摆在前面。
第三种可能,真正会收割 AI-native device 价值的不是 OpenAI,而是现有 OS 平台。Apple Intelligence 虽然进展慢,Google Gemini 也不完美,但它们天生拥有系统层权限、分发和默认位。OpenAI 就算模型领先,也可能被平台税吃掉。
第四种可能,所谓 phone 只是 OpenAI 对平台谈判的筹码。也就是说,它未必要真卖很多设备,只要让 Apple、Google、OEM 相信它有独立终端野心,就能换来更好的预装位、系统集成深度或 revenue share。这种情况下,市场会高估硬件本身,低估谈判价值。
第五种可能,也是我最警惕的一点:builder 容易把所有事都解释成“agent 终将接管入口”,然后过早重构路线。但用户行为比叙事顽固得多。很多时候,人们并不想和一个全能 agent 常驻共处,他们只想要一个稳定 app,把具体任务做完。
所以我的核心判断不是“OpenAI 手机一定成”。
而是更窄的一句:
一旦顶级模型公司开始认真争夺 hardware distribution,AI 行业的竞争单元就不再只是 model quality,而会转向默认入口、上下文所有权和 invocation control。
如果这点成立,那么今天很多 API、tooling、application 的估值逻辑,都要跟着重写。
相关推荐
基于 #distribution 推荐
sapprior-labs
SAP 砸 11.6 亿买控制权
SAP 对 18 个月大的德国 AI lab Prior Labs 投入 11.6 亿美元,同时限制客户 agent 只接入少数白名单系统如 Nvidia NemoClaw。重点不是一笔并购,而是 enterprise AI control plane 开始被应用巨头重新收口。
5月6日·techcrunch.com
anthropicfinancial-services
Anthropic 开始啃华尔街
2026 年 5 月,Anthropic 面向金融服务推出专用 AI agents。表面是垂直化产品发布,实质是闭源模型厂开始从“卖 intelligence”转向“卖 workflow + compliance + distribution”。
5月5日·www.bloomberg.com
Google CloudAgent Gateway
Google Cloud 拉 5 家安全厂商建 Agent 防火墙 — 企业 AI 落地卡在安全不是技术
Google Cloud 为 Agent Gateway 拉起安全厂商生态,解决 AI Agent 自主行动时的数据泄露和工具滥用风险。这标志着企业 AI 部署的瓶颈正从技术能力转向治理信心。
5月5日·cloud.google.com
paypalcoinbase
AI 不确定性开始传导就业
2026 年 5 月,PayPal、Coinbase 传出裁员,Palantir 商业销售不及预期。表面是软件股承压,真正值得看的是:AI 已开始从估值叙事传导到 headcount、预算与采购纪律。
5月5日·www.bloomberg.com
Microsoft大模型推理
微软让大模型推理提速4倍:AI行业下半场是抠基建成本
微软在系统顶会展示多项AI基建成果,包括让大模型推理吞吐量提升4倍的缓存共享技术。这说明AI竞争正从卷参数转向拼基础设施效率,降本将成主旋律。
5月5日·www.microsoft.com
Google CloudGemini
Google 发布 Gemini Agent 治理指南 — 大厂竞争焦点从写 Demo 转向管基建
Google Cloud 发布 Gemini 企业级 Agent 平台及五份生产部署指南,涵盖长时任务、治理与多智能体协同。这标志着行业焦点正从跑通 Demo 转向严管基建,企业用 AI 不再只是聊天,而是要建一套带权限和审计的数字员工体系。
5月5日·cloud.google.com