AI Pulse

AI写代码更稳了?因为你终于没把它当问答机用

有用户发现,Codex 5.4 在处理更大、更完整的任务时表现更好。一位设计师把整个页面的 HTML/CSS/JS 需求一次性粘贴进去:生成响应式落地页,适配移动端,带表单验证和暗色模式切换。

她过去习惯拆成三轮提问——先写结构、再加样式、最后补交互。这次没拆,结果生成的代码一次性通过本地测试,连 CSS 变量命名风格都和团队规范一致。而当她把同一需求切成三段分别提交,从第二段开始就出现类名不一致、事件绑定遗漏的问题。上下文割裂后,模型失去了对整体约束的感知。

Codex 5.4 没有变聪明,它只是更忠实地执行了“你给的越完整,我越知道你要什么”这条逻辑。当任务描述接近真实交付物的颗粒度,输出稳定性明显提升——不是因为参数更多,而是它终于不用猜你在想什么。

下次看到 AI 在复杂任务里异常稳定,先别归功于算力。它的输入可能刚好跨过了“人类拆解”和“机器原生理解”的分界线。

📎 阅读原文 · @rileybrown on 𝕏