Codex新增跨应用电脑操控，开发者可远程让AI干活

📅 2026 年 6 月 9 日 📖 约 2 分钟 @OpenAIDevs on 𝕏 AI开发工具API

OpenAI 给编程助手 Codex 加了跨应用操作电脑的能力。它不再只是个聊天窗口，而是能在 Mac 上像人一样干活：测试 Web 应用、从浏览器标签页收集信息、通过 Chrome 插件调 DevTools。Windows 开发者现在也能用上这功能。

快捷键 ⌘+⌘ 直接把截图丢进 Codex 线程，不用打字描述。Codex 的循环也更灵活，方便自定义和自动化。

你人不用在场。Codex 能在 ChatGPT 移动应用里持续跑，Mac 上你走开了它照样干活。这种异步工作方式意味着开发者不用一直盯着，先让它操作，回头再检查结果就好。

除了电脑操控，OpenAI 还给工具链加了新东西。Realtime API 有了新模型（Realtime-2），能搞语音代理、实时翻译和转录，已经在语音控制的 CRM 和站会工作流里测试过。Agents SDK 新增了 TypeScript 支持，带了沙盒代理和开源工具，开发 AI 代理的门槛降了。私有 MCP 服务器现在能通过出站 HTTPS 连 OpenAI 产品，企业不用暴露内部数据就能集成。

Codex 现在有 500 万用户。这次更新把 AI 从对话推到了操作层面，但离完全自主还有距离——目前不清楚 Windows 上的电脑操控跟 Mac 是否完全一样，Realtime-2 的具体性能没公布，私有 MCP 服务器的连接要不要额外配置或者付费，也还没说清楚。

阅读原文

📚 相关主题 API

📬 订阅 AI Pulse