AI Pulse

Claude Code变笨啰嗦忘事,三个bug现已修复

Claude Code变笨啰嗦忘事,三个bug现已修复

第一个问题发生在3月4日。Claude Code 的默认推理努力从 high 改成了 medium,用户明显感觉模型变笨了。4月7日,这个改动被回退。

但回退后的混乱没有消失。3月26日,Anthropic 上线了一个缓存优化:对话闲置超过一小时后,清空历史推理内容。结果有个 bug 导致每次请求都清空推理,模型记不住上下文,不断重复。同时,因为这个 bug 每次都要重新计算,缓存全部失效,用量额度比预期消耗得快。

这个问题在4月10日修复,但第三个问题已经上线了。4月16日,系统提示词里加了一条指令:工具调用之间的回复不超过25词,最终回复不超过100词。目的是减少啰嗦,结果伤害了编码质量——Opus 4.6和4.7的评估分数都掉了3%。4月20日,这个改动也被回退。

三个问题影响的时间段和流量不同,用户感知就是不稳定的降级——有时能用、有时不好用。Anthropic 确认,API 和推理层从未受影响。

为什么花了这么长时间才定位问题?Anthropic 的解释是:两个无关的内部实验掩盖了 bug。一个是关于消息队列的服务端实验,另一个是 CLI 下的展示方式变更——它们让缓存问题在大多数内部测试中无法复现。最终,Opus 4.7(而非上一代模型)在代码审查中发现了缓存 bug。

4月20日,v2.1.116 版本修复了所有已知问题。4月23日起,所有订阅用户的使用限制已经重置。

Anthropic 列出了后续改进:让更多内部员工使用公开版本的 Claude Code 做日常开发;加强代码审查工具;系统提示词的改动需要更严格的评估和灰度发布。他们还在 X 上开了 @ClaudeDevs 账号,专门解释产品决策和背后的逻辑。

阅读原文
📚 相关主题 工程安全

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部