Claude的MAX 20x套餐突然耗尽令牌，用户开始集体排查后台逻辑

📅 2026 年 4 月 7 日 📖 约 2 分钟 @trq212 on 𝕏 AI工程商业

程序员小张上周用MAX 20x写前端组件，下午三点提示‘令牌已用尽’，可他刚查过账单，上月只用了不到15%额度。

这不是个例。多个用户发现，同样写一个React Hook、调用一次API封装，这次消耗的令牌数比上周多出2–3倍。这意味着：你写的代码没变，但系统判定‘工作量’的方式变了。

有人翻出日志发现，真正吃掉令牌的不是主提示词，而是后台自动触发的‘子智能体’——比如自动补全类型定义、实时校验TS接口、甚至悄悄重试失败的代码生成步骤。这意味着：你没主动调用的功能，正在替你做决定，并替你付令牌。

更关键的是，这些子智能体几乎不进缓存——@Yairyup确认‘基本从不命中提示缓存’，而OpenClaw这类工具会进一步放大调用频次。这意味着：你以为的‘一次请求’，实际被拆成五六次独立计费动作。

别人没注意到，但我注意到了：Claude Code当前的用量模型，不是按‘你输入什么’计费，而是按‘它猜你想做什么’计费。

现在没人知道，那个‘猜’的过程，有没有开关，有没有日志，有没有回滚路径。