AI Pulse

它不是最强的AI,但工程师说现在最敢用

它不是最强的AI,但工程师说现在最敢用

Claude Opus 4.7 现在全面开放。它不是 Anthropic 能力最强的模型——Claude Mythos Preview 更强。但 Opus 4.7 是目前最稳、最准、最适配真实工程场景的 Opus 版本。Anthropic 的方向很明确:这条路的终点不是“更全能”,而是“更可靠”。

Opus 4.7 可以独立处理复杂的编码任务。在 93 项编码测试中,解决率比 Opus 4.6 提升 13%,其中 4 项是前代完全无法处理的任务。金融模块准确率从 0.767 升至 0.813。它会主动报告数据缺失,而不是生成看似合理实则错误的答案。

模型现在能质疑模糊指令、验证自身输出,并拒绝危险请求。它还首次内置了网络安全用途过滤器,自动识别并拦截漏洞利用、渗透测试等高风险指令。真正需要做红队演练的安全人员,可以申请加入 Cyber Verification Program 获得合规使用权限。

Anthropic 把 Mythos Preview 的部分能力“降维”到 Opus 4.7 上做真实环境压力测试,同时确保它不会越界。视觉能力也更强,能解析高分辨率技术图表和化学结构。生成的界面、文档、PPT 也更专业。

Opus 4.7 已上线所有 Claude 渠道、API 及云平台(Bedrock / Vertex AI / Foundry),定价不变:输入 5 美元/百万 token,输出 25 美元/百万 token。

📎 阅读原文 · www.anthropic.com