一个比 Opus 小两代的模型，正在追平它的表现

📅 2026 年 4 月 9 日 📖 约 1 分钟 @skirano on 𝕏 AI工程商业

上周，有人在会议间隙打开两个API控制台：一边调用 Opus 4.6 处理合同条款比对，另一边用 GPT-5.4 做同样的事。结果相近，但账单差了近三倍。

GPT-5.4 的模型规模，实际和 Sonnet（即 Claude Sonnet）相当；Opus 4.6 则是 Anthropic 当前最大、最贵的旗舰模型。这意味着：性能差距正在被压缩进更小的体积里。

API 成本直接反映在每千token报价上——GPT-5.4 的价格接近 Sonnet 水平，远低于 Opus。这意味着：以前必须用 Opus 才敢接的活，现在可以先用 GPT-5.4 跑通流程。

这不是‘小模型逆袭’的故事，而是推理效率的位移：当一个中等尺寸模型能在关键任务上稳定对标顶级模型时，企业不再需要为‘可能用到的峰值能力’提前支付溢价。

别人还在比较谁的旗舰更强，但真实场景里，真正被反复调用的，从来不是最强的那个，而是够快、够稳、够便宜的那个。

下一次你看到新模型发布，不妨先查查它的 API 定价页。