GPT-5.5 能自己搞定复杂编码任务，还比上一代更省 token

📅 2026 年 4 月 24 日 📖 约 17 分钟 OpenAI AI工程商业

OpenAI 发布了 GPT-5.5，称其为“迄今最聪明、最直观的模型”。你可以交给它一个混乱、多步骤的任务，它会自己规划路径、调用工具、检查结果、应对模糊信息，并坚持到完成。

它在编码上表现突出。相比 GPT-5.4，完成同样的 Codex 任务用的 token 显著减少，同时在 Terminal-Bench 2.0、SWE-Bench Pro 和内部 Expert-SWE 三项评测中全面领先。在 Codex 中，它能处理从实现、重构到调试、测试和验证的完整流程。早期测试者反馈，它更能理解系统结构：知道哪里出错、修复该放哪、改动会影响哪些模块。

性能提升没带来延迟代价。GPT-5.5 在真实服务中的每 token 延迟与 GPT-5.4 相当。按 Artificial Analysis 的 Coding Index，它提供当前最强的编码能力，成本却只有竞品前沿模型的一半。

但不是所有人都能立刻用上。GPT-5.5 目前只对 ChatGPT 和 Codex 的 Plus、Pro、Business 及 Enterprise 用户开放，更强的 GPT-5.5 Pro 则仅限后三档。API 接入“很快”推出，但需满足安全与安保要求。OpenAI 已通过红队测试、专项评估高级网络与生物能力，并收集了近 200 家早期伙伴的反馈。

GPT-5.5 把用户从执行者变成监督者，但这种转变眼下只有付费企业用户能体验。它的安全机制虽旨在防范高风险滥用，也可能限制某些科研场景的灵活性。API 上线时间、具体安全门槛、以及是否支持团队协作环境中的实时交互，仍是待解问题。

📎 阅读原文 · OpenAI

📬 订阅 AI Pulse