Claude Code Pro Max 配额 90 分钟耗尽始末

信号

使用 Claude Pro Max 套餐（官方宣传为「5 倍用量」）的用户反映，在进行 Claude Code 的活跃会话时，配额往往在约 90 分钟内就会耗尽——而他们自认为只是正常强度的使用。这一问题已在 GitHub 上引发热议（issue #45756），在 Hacker News 上获得 136 个赞和 65 条评论。核心诉求很明确：「5 倍」这个乘数完全不透明。没人知道基准值是什么、 token 在 agentic 循环中如何计算、计数器何时重置。你只是在会话进行到一半时突然被切断。

这不是少数极端案例。出现问题的都是在做正常编码工作的用户——并非在跑批量任务或对 API 进行压力测试。

开发者视角

这本质上是一个被包装成计费问题的杠杆效率问题。

Claude Code 的威力来自 agentic 循环：读取文件、编写代码、运行测试、读取输出、反复迭代。每一次循环迭代都会消耗你从未「显式发送」过的 token。一条「修复这个 bug」的 prompt，在内部可能会扩展为超过 10,000 个 token 的上下文——包括文件读取、工具调用、思维链推理。「5 倍配额」听起来很慷慨，直到你意识到分母根本看不见。

真正重要的杠杆计算是这样的：如果你是独立开发者，Claude Code 会话在午后突然中断，你失去的不只是 token——你失去的是 心流状态。这才是真实成本。一个每月 $20、下午一点就断线的套餐，其价值还不如一个每月 $5 但可预期、可规划的方案。

这对护城河意味着什么？

被摧毁的：「让 Claude Code 持续运行」的工作流。你无法将其作为全天候的持久编码助手来使用。
被创造的：对于那些自行监控 token 用量、围绕 API 直接构建配额感知工具的开发者来说，这是一个机会。
现实核查：直接使用 API（按 token 付费）没有配额悬崖。如果你是频繁触及限制的重度用户，直接 API + token 预算管理器在经济账上很可能优于统一定价的订阅套餐。

借用 DHH 的风格说一句： Anthropic 在销售一个「5 倍」的数字，却从未定义「1 倍」是什么。这是产品层面的失败，不是用户的问题。不透明的限制，是对重度用户征收的一种隐性税。

工具与技术栈

受影响的使用环境

Claude Code — Anthropic 的 agentic 编码 CLI。在终端内运行，可读写你的代码库。重度使用需要 Pro 或 Pro Max 订阅。
Pro Max 套餐 — 官方描述为相较标准 Pro「5 倍用量限制」。实际 token 上限：未公开记录（请查阅 anthropic.com/pricing 了解当前套餐详情）。

Issue 中正在讨论的临时解决方案

会话批处理： 将所有 Claude Code 工作集中在一个专注的上午时段内完成。不要让它空转（在某些 agentic 框架中，空闲上下文仍会计入用量）。
缩减上下文窗口：使用 .claudeignore 将大型文件或目录排除在 Claude Code 的文件读取范围之外。每次循环的上下文越少，在触及配额前能完成的循环就越多。
切换至 API：通过直接 API 使用 claude-3-5-sonnet-20241022，按 token 付费，没有配额悬崖，支出由你掌控。当前 token 定价请参阅 anthropic.com/api。
替代方案： Cursor + API Key — Cursor 支持携带自己的 Anthropic API Key。使用相同的 Claude 模型，无订阅配额限制，按 token 可预期地付费。
替代方案：Aider — 开源 CLI 编码助手。pip install aider-chat，接入你自己的 API Key，没有中间层的配额约束。
```
pip install aider-chat 
aider --model claude-3-5-sonnet-20241022 --api-key anthropic=YOUR_KEY
```

监控你自己的用量

如果你选择继续使用订阅套餐，至少应该增加用量可见性：

# Claude Code 目前 尚未原生暴露 token 计数
# 代理绕过方案 ：通过本地代理记录 Claude Code 的 API 调用
# m itmproxy 或 proxyman 等工具可以拦截并记录 token 用量
mitmproxy --mode regular --listen-port 8080

这个方案虽然粗糙，但在 Anthropic 正式在 Claude Code 内部推出用量仪表板之前，不失为一个有效的过渡手段。

本周可以动手做的事

构建一个 Claude Code 配额监控工具。

具体构想如下：一个小脚本，嵌入你与 Claude Code 之间，追踪每个会话的近似 token 用量，并在你触及上限之前发出预警。

粗略实现路径：

使用 mitmproxy 或本地 HTTPS 代理拦截 Claude Code 的 API 调用。
从每个响应中解析 usage 字段（input_tokens、 output_tokens）。
累计滚动会话总量，记录到本地 SQLite 文件。
当超过阈值（例如估算日预算的 80%）时，在 Mac 上通过 osascript、在 Linux 上通过 notify-send 触发桌面通知。

# 伪代码示意
for each intercepted response:
  tokens_used += response.usage.input_tokens + response.usage.output_tokens
  if tokens_used  > DAILY_BUDGET * 0.8:
    notify("Claude Code: 配额已使用 80%——请收 尾当前工作或切换至 API")

这是一个周末项目的体量。将其作为开源工具发布，发帖到 Hacker News 和对应的 GitHub Issue 讨论串。那里有 136+ 位饱受困扰的开发者，他们今天就会安装它。这就是你的初始分发渠道。

更长远的玩法：将其演化为一个具备配额感知能力的 Claude Code 封装工具，支持会话调度（「上午消耗预算，为下午保留 X%」）。每月收费 $5。Anthropic 的不透明，就是你的市场机会。

Claude Code Pro Max 配额 90 分钟耗尽始末

信号

开发者视角

工具与技术栈

Issue 中正在讨论的临时解决方案

监控你自己的用量

本周可以动手做的事

相关推荐

禁 Anthropic，不是安全，是自废防线

Anthropic 断供 Mythos 的真信号

Mythos 管制不是公关战

Anthropic 被禁，不只是安全

Amazon 不只是在敲打 Anthropic

Anthropic 断供不是安全问题

Claude Code Pro Max 配额 90 分钟耗尽始末

信号

开发者视角

工具与技术栈

Issue 中正在讨论的临时解决方案

监 控你自己的用量

本周可以动手做 的事

相关推荐

禁 Anthropic，不是安全，是自废防线

Anthropic 断供 Mythos 的真信号

Mythos 管制不是公关战

Anthropic 被禁，不只是安全

Amazon 不只是在敲打 Anthropic

Anthropic 断供不是安全问题

监控你自己的用量

本周可以动手做的事