DeepSeek V4-Pro 每百万 tokens 定价 3.48 美元,是 GPT-5.5 的 1/22 — 大模型竞争的主战场已经从"谁最强"变成了"谁更便宜够用"。

这是什么

DeepSeek 在 GPT-5.5 发布同一天放出 V4,没有发布会,一篇技术报告加开源。两个型号:V4-Pro(旗舰,1.6 万亿总参数)和 V4-Flash(经济款,284B 总参数),后者价格仅 $0.28/M tokens。

便宜不是靠烧钱补贴。V4 用了三招压成本:MoE 架构(Mixture of Experts,专家混合,每次推理只激活 3% 的参数)、混合注意力机制(在百万 token 上下文下,推理算力只需上一代的 27%)、三档推理模式(不是每个请求都要开"深度思考")。

性能定位很诚实:落后 SOTA 闭源模型约 3-6 个月。但长上下文理解(MRCR 1M 超过 Gemini 3.1 Pro)和数学(Putnam 竞赛满分)上有亮点。迁移成本几乎为零,改一行代码即可。

行业怎么看

独立开发者社区明显兴奋。Reddit 真实案例:24/7 自主 Agent 系统,4 周消耗 1 亿 tokens,DeepSeek 账单 $280,换 GPT-5.5 要 $3000+。这不是省零花钱,是"能跑"和"跑不起"的区别。DeepSeek 在长 Agent 循环中一致性也更好,不像过度 RLHF(基于人类反馈的强化学习)的模型容易"漂移" — 不断道歉、反复确认、拒绝执行。

但低价策略的可持续性值得追问。3-6 个月的性能差距在快速迭代的大模型赛道上并不小,对准确率要求极高的企业场景(医疗、法律、金融),"够用"可能不够。另有观点认为,V4 的低价可能挤压整个行业利润空间,迫使对手跟进降价,最终谁都无法健康盈利 — 这不是第一次在科技行业看到这种剧本。

对普通人的影响

对企业 IT:大模型采购成本出现数量级下降,但需要重新评估"够用"的边界 — 便宜不代表适合所有场景,尤其是容错率低的企业核心业务。

对个人职场:独立开发者和小团队也能跑 7×24 小时 Agent(能自主感知环境、做决策并执行动作的 AI 系统),AI 应用创业的门槛从"融资能力"转向"产品判断力"。

对消费市场:底层模型价格战意味着终端 AI 应用有更大降价空间,消费者用上更便宜甚至免费的 AI 工具是大概率事件。