OpenAI API 在 2025–2026 年密集推出 GPT-5 系列、Sora-2、GPT Image 2 和 Responses API 生态
OpenAI API 在过去一年(2025 年初至 2026 年 4 月)发布了超过 80 项更新。其中最核心的不是单个模型,而是 API 层的结构性演进:Responses API 已成为新能力的默认载体,Chat Completions 退居为兼容层,Assistants API 明确进入 sunset 路径。 这意味着:开发者调用‘智能’的方式,正从‘发一条消息等一个回复’,转向‘启动一个带工具、记忆、沙箱和状态管理的长期运行体’。
GPT-5 系列已形成完整梯队:GPT-5.5(专业级)、GPT-5.4(主力)、GPT-5.2(旗舰)、GPT-5.1(响应优先),以及 mini/nano 等轻量变体。GPT-5.5 支持 100 万 token 上下文、图像输入、结构化输出、函数调用、内置计算机操作、Web 搜索、技能(Skills)和批处理(Batch)。 这意味着:它不再只是‘回答问题’,而是能接管一整段需要多步推理、跨模态理解、外部工具协同的复杂工作流——比如自动分析带图财报、修改代码并截图验证 UI 变化、再生成汇报 PPT。
Sora API 扩展至 Sora-2 和 Sora-2-pro:支持可复用角色、最长 20 秒生成、1080p 输出(0.7 美元/秒)、视频编辑(/v1/videos/edits)和批处理。GPT Image 2 同步上线,支持灵活尺寸、高保真输入、按 token 计费和 Batch。 这意味着:视频与图像生成不再是单次创作行为,而开始具备工程化特征——可复用组件、可批量调度、可嵌入工作流、可精确计价。
Responses API 已不是‘另一个接口’,而是新能力的事实入口:Compaction(客户端上下文压缩)、Skills(本地/容器化执行)、Hosted Shell(托管终端)、Tool Search(运行时动态加载工具)、Phase 标签(区分中间思考与最终答案)、WebSocket 模式、企业密钥管理(EKM)、IP 白名单、细粒度审计日志。 这意味着:OpenAI 正把 API 从‘调用模型’的管道,升级为‘部署智能体’的操作系统——安全、可观测、可编排、可扩展。 这条路能不能走通,取决于工具本身够不够用。但至少,它把‘要不要试’这件事,变简单了。