你没感觉错,Claude真变傻过:三次手滑,次次离谱
Anthropic终于认了:你感觉Claude变傻,不是错觉。三个独立改动分别搞砸了Claude Code、Agent SDK和Cowork,API倒是没中招。问题在于,这些bug在内部测试里根本藏不住——因为它们混在正常波动里,像饭馆后厨偷偷换便宜酱油,食客觉得味不对,厨师却说‘配方没动’。
第一次手滑在3月4日。他们把Code的默认推理努力从“high”降到“medium”,想治延迟,结果用户宁愿多等几秒也要聪明点。这就像游戏里关掉画质省电,结果帧数没涨,手感还糊了。4月7日赶紧回滚。
第二次更离谱。3月26日上线的缓存清理本该只清一次旧会话,结果每轮对话都清上下文。Sonnet 4.6和Opus 4.6当场变金鱼记忆,用量限额哗哗掉。我试过那几天写脚本,完蛋,文件名果然都是乱码。4月10日靠v2.1.101才止血。
第三次是提示词作死。4月16日加了条规矩:“工具调用间文本不超过25字”,本想治Opus 4.7话痨,结果和其他指令打架,编码能力直接掉3%。图标还蛮可爱的,逻辑却崩了。4月20日连夜撤回。
现在默认设置重新偏向质量:Opus 4.7用“xhigh”,其他用“high”。上下文不再莫名蒸发,4月23日还给所有人重置了额度——算是赔了个充电宝,虽然手机已经烧了。
最讽刺的是,回溯测试发现Opus 4.7自己能揪出3月26日那个bug,Opus 4.6却不行。Anthropic现在说要让员工用公开版而非测试版,还要搞模型专属门控。听起来像饭馆老板终于决定自己吃自家菜。
他们还开了@ClaudeDevs账号和GitHub更新线程。不过说实话,等bug出了再透明,不如一开始别把锅甩给‘用户反馈波动’。牛皮吹爆了。