信号
使用 Claude Pro Max 套餐(官方宣传为「5 倍用量」)的用户反映,在进 行 Claude Code 的活跃会话时,配额往往在 约 90 分钟内就会耗尽——而他们自认 为只是正常强度的使用。这一问题已在 GitHub 上引发热议(issue #45756),在 Hacker News 上获得 136 个赞和 65 条评论。核心诉求很 明确:「5 倍」这个乘数完全不透明。没人知道基准值是什么、 token 在 agentic 循环中如何计算、计数器何时重置。你只是 在会话进行到一半时突然被切断。
这不是少 数极端案例。出现问题的都是在做正常编码工作的 用户——并非在跑批量任务或对 API 进行压力测试。
开发者视角
这本质上是一个被 包装成计费问题的杠杆效率问题。
Claude Code 的威 力来自 agentic 循环:读取文件、编写代码、运行测试、读取输出、反复迭代。每一 次循环迭代都会消耗你从未「显式发送」过的 token。一条「修复这个 bug」 的 prompt,在内部可能会扩展为超过 10,000 个 token 的上下文——包括文件读取、工具 调用、思维链推理。「5 倍配额」听起来很慷慨,直到你意识到分 母根本看不见。
真正重要的 杠杆计算是这样的:如果你是独立开发者,Claude Code 会话在午后 突然中断,你失去的不只是 token——你失去的是 心流状态。这才是真实成本。一 个每月 $20、下午一点就断线 的套餐,其价值还不如一个每月 $5 但可预 期、可规划的方案。
这对护 城河意味着什么?
- 被摧毁的:「 让 Claude Code 持续运行」的工作流。你无法将其作为全天候的持久 编码助手来使用。
- 被创造的:对于那些自行监 控 token 用量、围绕 API 直接构建配额感 知工具的开发者来说,这是一个机会。
- 现实核查 :直接使用 API(按 token 付费)没有配额 悬崖。如果你是频繁触及限制的重度用户,直接 API + token 预算管理器在经济账上很 可能优于统一定价的订阅套餐。
借 用 DHH 的风格说一句: Anthropic 在销售一个「5 倍」的数字,却从未 定义「1 倍」是什么。这是产品层面的失败,不 是用户的问题。不透明的限制,是对重 度用户征收的一种隐性税。
工具与技术栈
受影响的使用环境- Claude Code — Anthropic 的 agentic 编码 CLI。在终端内运行,可读写你的代码库 。重度使用需要 Pro 或 Pro Max 订阅。
- Pro Max 套餐 — 官方描述为相较标准 Pro「5 倍用量限制」。实际 token 上限:未公开记录(请查阅 anthropic.com/pricing 了解当前套餐详情)。
Issue 中正在讨论的临时解决方案
- 会话批处理: 将所有 Claude Code 工作集中在一个专注的上午时段内 完成。不要让它空转(在某些 agentic 框架中,空闲上下文仍会计 入用量)。
- 缩减上下文窗口:使用
.claudeignore将大型 文件或目录排除在 Claude Code 的文件读取范围之外。每次循环的 上下文越少,在触及配额前能完 成的循环就越多。 - 切换至 API:通过直 接 API 使用
claude-3-5-sonnet-20241022,按 token 付费,没有配额悬崖, 支出由你掌控。当前 token 定 价请参阅 anthropic.com/api。 - 替代方案: Cursor + API Key — Cursor 支持携带自己的 Anthropic API Key。使用相同的 Claude 模型, 无订阅配额限制,按 token 可预期地付费。
- 替代方 案:Aider — 开源 CLI 编码助手。
pip install aider-chat,接入你自己的 API Key, 没有中间层的配额约束。pip install aider-chat aider --model claude-3-5-sonnet-20241022 --api-key anthropic=YOUR_KEY
监 控你自己的用量
如果你选择继续使用订阅套餐,至少应该增 加用量可见性:
# Claude Code 目前 尚未原生暴露 token 计数
# 代理绕过方案 :通过本地代理记录 Claude Code 的 API 调用
# m itmproxy 或 proxyman 等工具可以拦截并记录 token 用量
mitmproxy --mode regular --listen-port 8080
这个方案虽然粗糙,但在 Anthropic 正式在 Claude Code 内部推出用量仪表板之前,不失为一个有效的过 渡手段。
本周可以动手做 的事
构建一个 Claude Code 配额监控工具。
具 体构想如下:一个小脚本,嵌入你与 Claude Code 之 间,追踪每个会话的近似 token 用量,并在你 触及上限之前发出预警。
粗略实 现路径:
- 使用
mitmproxy或本地 HTTPS 代理拦截 Claude Code 的 API 调用。 - 从 每个响应中解析
usage字段(input_tokens、output_tokens)。 - 累计滚动会话总量,记 录到本地 SQLite 文件。
- 当超过阈值(例如估算日预 算的 80%)时,在 Mac 上通过
osascript、 在 Linux 上通过notify-send触发桌面通知。
# 伪代码示意
for each intercepted response:
tokens_used += response.usage.input_tokens + response.usage.output_tokens
if tokens_used > DAILY_BUDGET * 0.8:
notify("Claude Code: 配额已使用 80%——请收 尾当前工作或切换至 API")
这是一个周末项目的 体量。将其作为开源工具发布,发 帖到 Hacker News 和对应的 GitHub Issue 讨论串。那 里有 136+ 位饱受困扰的开发者,他们今 天就会安装它。这就是你的初始分发渠道。
更长远的玩法:将其演化 为一个具备配额感知能力的 Claude Code 封装工 具,支持会话调度(「上午消 耗预算,为下午保留 X%」)。每 月收费 $5。Anthropic 的不透明,就 是你的市场机会。