Claude的MAX 20x套餐突然耗尽令牌,用户开始集体排查后台逻辑
程序员小张上周用MAX 20x写前端组件,下午三点提示‘令牌已用尽’,可他刚查过账单,上月只用了不到15%额度。
这不是个例。多个用户发现,同样写一个React Hook、调用一次API封装,这次消耗的令牌数比上周多出2–3倍。 这意味着:你写的代码没变,但系统判定‘工作量’的方式变了。
有人翻出日志发现,真正吃掉令牌的不是主提示词,而是后台自动触发的‘子智能体’——比如自动补全类型定义、实时校验TS接口、甚至悄悄重试失败的代码生成步骤。 这意味着:你没主动调用的功能,正在替你做决定,并替你付令牌。
更关键的是,这些子智能体几乎不进缓存——@Yairyup确认‘基本从不命中提示缓存’,而OpenClaw这类工具会进一步放大调用频次。 这意味着:你以为的‘一次请求’,实际被拆成五六次独立计费动作。
别人没注意到,但我注意到了:Claude Code当前的用量模型,不是按‘你输入什么’计费,而是按‘它猜你想做什么’计费。
现在没人知道,那个‘猜’的过程,有没有开关,有没有日志,有没有回滚路径。