AI Pulse

一个比 Opus 小两代的模型,正在追平它的表现

上周,有人在会议间隙打开两个API控制台:一边调用 Opus 4.6 处理合同条款比对,另一边用 GPT-5.4 做同样的事。结果相近,但账单差了近三倍。

GPT-5.4 的模型规模,实际和 Sonnet(即 Claude Sonnet)相当;Opus 4.6 则是 Anthropic 当前最大、最贵的旗舰模型。这意味着:性能差距正在被压缩进更小的体积里。

API 成本直接反映在每千token报价上——GPT-5.4 的价格接近 Sonnet 水平,远低于 Opus。这意味着:以前必须用 Opus 才敢接的活,现在可以先用 GPT-5.4 跑通流程。

这不是‘小模型逆袭’的故事,而是推理效率的位移:当一个中等尺寸模型能在关键任务上稳定对标顶级模型时,企业不再需要为‘可能用到的峰值能力’提前支付溢价。

别人还在比较谁的旗舰更强,但真实场景里,真正被反复调用的,从来不是最强的那个,而是够快、够稳、够便宜的那个。

下一次你看到新模型发布,不妨先查查它的 API 定价页。

📎 阅读原文 · @skirano on 𝕏