GPT-5.5 能自己搞定复杂编码任务,还比上一代更省 token
OpenAI 发布了 GPT-5.5,称其为“迄今最聪明、最直观的模型”。你可以交给它一个混乱、多步骤的任务,它会自己规划路径、调用工具、检查结果、应对模糊信息,并坚持到完成。
它在编码上表现突出。相比 GPT-5.4,完成同样的 Codex 任务用的 token 显著减少,同时在 Terminal-Bench 2.0、SWE-Bench Pro 和内部 Expert-SWE 三项评测中全面领先。在 Codex 中,它能处理从实现、重构到调试、测试和验证的完整流程。早期测试者反馈,它更能理解系统结构:知道哪里出错、修复该放哪、改动会影响哪些模块。
性能提升没带来延迟代价。GPT-5.5 在真实服务中的每 token 延迟与 GPT-5.4 相当。按 Artificial Analysis 的 Coding Index,它提供当前最强的编码能力,成本却只有竞品前沿模型的一半。
但不是所有人都能立刻用上。GPT-5.5 目前只对 ChatGPT 和 Codex 的 Plus、Pro、Business 及 Enterprise 用户开放,更强的 GPT-5.5 Pro 则仅限后三档。API 接入“很快”推出,但需满足安全与安保要求。OpenAI 已通过红队测试、专项评估高级网络与生物能力,并收集了近 200 家早期伙伴的反馈。
GPT-5.5 把用户从执行者变成监督者,但这种转变眼下只有付费企业用户能体验。它的安全机制虽旨在防范高风险滥用,也可能限制某些科研场景的灵活性。API 上线时间、具体安全门槛、以及是否支持团队协作环境中的实时交互,仍是待解问题。