AI Pulse

AI现在能自己跑完整个编程项目,无需你步步紧盯

AI现在能自己跑完整个编程项目,无需你步步紧盯

NVIDIA 出了一款叫 Codex 的 AI 助手,基于 GPT‑5.5,跑在 NVIDIA 自家的 GB200 和 GB300 基础设施上。

Codex 能处理比以往更长的会话,而且不只是执行指令——它会主动翻出原始提示里没提到的问题和想法。简单说,你丢给它一个复杂的编程或研究任务,它自己写代码、调试、测试,不需要你一步一步盯着。

真实案例:几小时搭出一个播客应用

NVIDIA 高级软件工程师 Dennis Hannusch 说,Codex 成了他处理复杂工程任务的首选工具。“它能发现其他模型找不到的 bug 和漏洞。”

Hannusch 用它把一个内部平台从原型变成了生产就绪的系统,可扩展性和可靠性都提上去了——用早期模型很难做这样的事。团队还基于 Codex,在几小时内搭了一个内部播客录制应用,类似 Riverside。“考虑到隐私约束,用传统方式采购软件得花几周时间。”Hannusch 说。

Codex 桌面应用有计算机交互能力,系统在构建过程中自己就测了视频和音频录制。“我什么都不用做——它自己构建并测试完成,完全自主。”

他评价说,Codex 彻底改变了“什么值得构建”的门槛。

研究加速:10 倍速的实验循环

AI 研究员 Shaunak Joshi 发现 Codex 把他的实验运行速度提升了 10 倍,因为它能处理完整的端到端机器学习研究流程。

具体来说,从识别研究领域、写实验脚本到在远程机器上运行,Codex 都自动做了。Codex 应用支持 SSH,Joshi 不再操心远程主机的登录和设置,直接从笔记本就能跑大型机器学习负载。

Joshi 还提到,Codex 帮他追踪整个证据链里的片段,并建议了一个知识图谱来可视化概念如何关联。“GPT‑5.5 作为创意伙伴是个巨大的解锁,尤其是在知识工作方面。它比竞争对手更有创造力。”

机器翻译:Python 重写成 Rust,效率提升 20 倍

Codex 在机器翻译上也很能打。Hannusch 说:“如果你有一个旧的代码库,性能不佳,Codex 很擅长做机器翻译。很多人把 Python 代码库交给 GPT‑5.5,它重写为 Rust,效率提升了大约 20 倍。”老旧软件可以低成本升级,不用苦等开发者重写,用户就能体验到更流畅、更省电的应用。

未来与不确定

Hannusch 表示他们只是触到了 Codex 能力的表面:“我很期待继续构建真实系统,看它能走多远。”

目前还不清楚 Codex 在更复杂、更开放的任务中自主性表现如何,是否存在错误或安全风险。对非 NVIDIA 用户是否可用、定价和访问方式也没公布。GPT‑5.5 相比 Claude、Gemini 等竞品的具体优势缺乏独立评测。Codex 的“计算机交互”能力具体怎么工作、是否支持所有桌面应用,还有待观察。

可以肯定的是,AI 正在从“帮你写几行代码”进化到“帮你跑完整个项目”。

📎 阅读原文 · OpenAI

📬 订阅 AI Pulse

每天两次更新,不错过重要信号

▲ 回到顶部