AI Pulse

Codex新增跨应用电脑操控,开发者可远程让AI干活

Codex新增跨应用电脑操控,开发者可远程让AI干活

OpenAI 给编程助手 Codex 加了跨应用操作电脑的能力。它不再只是个聊天窗口,而是能在 Mac 上像人一样干活:测试 Web 应用、从浏览器标签页收集信息、通过 Chrome 插件调 DevTools。Windows 开发者现在也能用上这功能。

快捷键 ⌘+⌘ 直接把截图丢进 Codex 线程,不用打字描述。Codex 的循环也更灵活,方便自定义和自动化。

你人不用在场。Codex 能在 ChatGPT 移动应用里持续跑,Mac 上你走开了它照样干活。这种异步工作方式意味着开发者不用一直盯着,先让它操作,回头再检查结果就好。

除了电脑操控,OpenAI 还给工具链加了新东西。Realtime API 有了新模型(Realtime-2),能搞语音代理、实时翻译和转录,已经在语音控制的 CRM 和站会工作流里测试过。Agents SDK 新增了 TypeScript 支持,带了沙盒代理和开源工具,开发 AI 代理的门槛降了。私有 MCP 服务器现在能通过出站 HTTPS 连 OpenAI 产品,企业不用暴露内部数据就能集成。

Codex 现在有 500 万用户。这次更新把 AI 从对话推到了操作层面,但离完全自主还有距离——目前不清楚 Windows 上的电脑操控跟 Mac 是否完全一样,Realtime-2 的具体性能没公布,私有 MCP 服务器的连接要不要额外配置或者付费,也还没说清楚。

阅读原文
📚 相关主题 API

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部