AI Pulse

GPT-5.5 不用你指挥,自己把活干完了

GPT-5.5 不用你指挥,自己把活干完了

我去试了 GPT-5.5,第一反应是:这玩意儿终于不用我手把手喂指令了。它不像以前那样等你一句句指挥,而是自己琢磨目标、调工具、验结果,直到把事儿干完。

就像饭馆里点了个“随便做点好吃的”,结果厨师真给你端出一桌有头有尾的宴席——连餐具都摆好了。给张图加段话,它能拉 NASA 的真实轨道数据,在 WebGL + Vite 里搭出个能拖拽旋转的阿耳忒弥斯II任务3D模型,图标还蛮可爱的。

延迟跟 GPT-5.4 差不多,但干活利索多了。同样写代码,用的 token 少了一截。在 Artificial Analysis 编码指数上跑赢对手,成本却只有一半。Terminal-Bench 2.0 里命令行规划准确率 82.7%,SWE-Bench Pro 修 GitHub 真实 bug 能到 58.6%,连内部那个要人类肝20小时的 Expert-SWE 长任务,也比前代强。

现在人机协作变了味儿:不再是“你问一句我答一句”,而是“你说目标,我负责闭环”。

不过别高兴太早——GPT-5.5 Pro 只对 Pro 及以上用户开放,API 还在和合作伙伴磨安全适配。我这种普通 Plus 用户,先拿基础版练练手吧。

牛皮吹爆了?至少这次,它真把井挖到了水。

📎 阅读原文 · OpenAI

📬 订阅 AI Pulse

每天两次更新,不错过重要信号

▲ 回到顶部