Opus 4.8 上线:快三倍、更诚实,价格没涨
Claude Opus 4.8 来了。它是 Opus 4.7 的直接升级版,价格一分没涨——常规使用依然是 $5/百万输入 token、$25/百万输出 token。
最大的变化在速度和成本。快速模式下,Opus 4.8 跑快 2.5 倍,价格却只有之前模型的 1/3。这对高频调用的开发者来说直接降低了预算。
用户现在可以在 claude.ai 上控制 Claude 花多少精力处理任务。Opus 4.8 默认用高努力,编码任务消耗的 token 数和 Opus 4.7 默认模式差不多,但效果更好。
基准测试上它拿了几项第一。Super-Agent 测试里它是唯一完成所有案例的模型,成本与 GPT-5.5 持平。Legal Agent Benchmark 上它拿了最高分,也是第一个突破 10% all-pass 标准的模型。浏览器代理测试 Online-Mind2Web 得分 84%,超过 Opus 4.7 和 GPT-5.5。
更诚实。Anthropic 的对齐评估显示,Opus 4.8 允许代码缺陷未加评论通过的可能性比前代低了 4 倍,同时在支持用户自主性和以用户最佳利益行事上达到了新高。不良行为率远低于 Opus 4.7,与最佳对齐模型 Claude Mythos Preview 相当。
Claude Code 新增了“动态工作流”,可以在一个会话里并行跑数百个子代理处理大规模任务。这个功能对 Enterprise、Team 和 Max 计划开放。
开发者方面,Messages API 现在支持在消息数组里放系统条目,中途改指令不用破坏提示缓存或走用户轮次。更新更顺了。
最后,Anthropic 完成了 650 亿美元 H 轮融资,投后估值 9650 亿美元。他们计划发布比 Opus 更智能的新模型类别,代号 Project Glasswing,Claude Mythos Preview 已在网络安全场景里用了。