AI Pulse

代理型AI如何将知识工作从单次交互转变为委托式长周期任务

代理型AI如何将知识工作从单次交互转变为委托式长周期任务

代理如何改变工作方式

代理型AI(Agentic AI)将知识工作的基本单位从单次交互转变为委托式的长周期任务。聊天机器人交互往往简短且独立完成,而代理可以独立运行几分钟甚至几小时,同时协调工具调用、与环境交互并迭代逼近解决方案。因此,代理正迅速成为工作中最强大的AI工具。

过去一年,我们在OpenAI内部亲眼目睹了这一转变。在Codex向公众发布后的最初几个月里,ChatGPT仍然是OpenAI内部默认的工作AI工具。截至2025年8月,OpenAI员工平均只有不到10%的token用在Codex上。如今,包括法律和招聘等非技术部门在内的所有部门,都将Codex作为其主要工作AI工具。这一模式反映了我们认为随着代理工具能力和可及性的提升,未来工作将呈现的样貌。

Codex的采用率与其能力同步增长。随着Codex利用更强模型和新产品功能,它能够承担越来越多的生产性任务。在个人用户、组织用户和OpenAI员工三个群体中,我们记录了过去一年的四个趋势:

- 人们使用Codex处理更长周期的工作。 到2026年5月,抽样个人用户中80.6%至少提出过一次估计相当于人类工作超过30分钟的Codex请求,70.2%至少提出过超过一小时的请求,25.6%至少提出过超过八小时的请求。

- Codex成为OpenAI每个部门的主要AI工具。 工程部门率先迁移,但法律、财务和招聘部门在2026年4月左右也转向以Codex为主要AI工具。对于OpenAI员工而言,Codex使用现在占其输出token的85%以上。由于Codex用户往往比非用户使用更多token,其在总token中的占比更高:Codex占OpenAI内部每周输出token的99.8%。

- 非开发者采用率增长尤为迅速,超过了开发者。 自2025年8月以来,个人用户中的非开发者增长了137倍,组织用户增长了189倍,OpenAI内部增长了12倍。

- Codex使OpenAI员工能够完成岗位描述之外的任务。 虽然技术使用在工程师中仍然最为普遍,但非技术用户经常使用Codex进行编码或技术执行,包括自动化、数据转换、工具开发、调试和结构化分析。

代理工作时间更长,任务更困难

近四分之一的Codex请求涉及需要人类超过一小时才能完成的任务¹。随着Codex独立处理长上下文能力的提高,用户从短交互转向更困难、周期更长的任务。下图估算了跨越四个时间阈值的个人用户比例:需要人类超过30分钟、超过一小时、超过四小时和超过八小时的任务²。从2025年12月到2026年5月,提出估计对应人类工作超过30分钟请求的用户比例上升到80.6%。提出超过一小时请求的用户比例上升到70.2%。提出超过八小时工作请求的比例从低基数增长最快。

代理使用的增长可以从每日Codex运行时间中看出。在OpenAI的日活跃用户中,最重度用户要求Codex在一天内运行数小时的代理工作。到2026年6月,第99百分位的用户每天经常生成超过60小时的Codex代理轮次,分布在多个并行代理中。随着Codex变得更强大且可并行化,用户从一次只要求Codex给出一个答案,逐渐转向在一天内编排多个代理任务。

采用率继续从工程师扩展到OpenAI其他部门

OpenAI的工程师率先逐步采用Codex。到2025年12月,公司工程师平均将大部分OpenAI产品使用转移到Codex。如今,工程师平均99%的输出token来自Codex而非ChatGPT。法律、财务和招聘部门较晚(约2026年4月)才将多数使用转向Codex,但转变更为迅速。OpenAI的律师或招聘人员现在平均超过85%的输出token来自Codex。

过去六个月,Codex在OpenAI内部的使用深度和强度都在增加。在活跃内部用户中,各部门的综合输出token变化量急剧上升。研究部门增幅最大:到2026年6月,中位使用量是2025年11月的56倍。客户支持增长32倍,工程增长27倍,而法律增长较缓但仍达到11月水平的13倍。

这两个模式共同说明了Codex如何改变了OpenAI使用AI进行生产性工作的方式。在整个公司,用户正从聊天机器人转向代理作为其主要AI交互形式,并部署呈指数增长的代理劳动力。

非开发者是增长最快的用户群体

在所有用户群体(OpenAI员工、组织用户和个人用户)中,Codex的使用都始于开发者——这很自然,因为Codex最初是作为编码工具。但随着Codex扩展至更通用的知识工作,非开发者的采用率增长更快。如下图所示,在个人、组织和OpenAI员工群体中,每周非开发者用户增长速度均超过开发者。到2026年6月初,自2025年8月以来,非开发者个人用户增长了137倍。非开发者组织用户增长了189倍,而OpenAI内部非开发者用户增长了12倍——可能是因为该群体起点已远高于平均水平。

这种转变并不意味着每个非开发者都以工程师的方式使用Codex。相反,它意味着更多非开发者正在使用Codex进行某种代理工作。

Codex正在拓展潜在生产性工作的边界

Codex使非技术部门能够加速过去因缺乏技术专长而受阻的工作流程。下方的热力图比较了OpenAI内部推断的岗位与Codex输出所代表的工作类型。工程和编码是数据科学与研究部门的最大类别,而知识工作是财务与业务运营、市场营销、运营及其他部门的最大类别。

然而,代理工具可以扩展单个员工的能力范围。例如,业务部门员工使用Codex完成的工作中,超过四分之一是工程或编码任务。代理可以降低跨任务边界的成本,帮助员工完成以往需要更专业技术人员支持的相邻工作。

岗位 vs. 用Codex完成的工作

| 工作类别 | 工程 | 数据科学/研究 | 财务/业务运营 | 产品/市场/运营 | 其他 | |---------|------|-------------|-------------|---------------|------| | 各部门输出token占比 | ... | ... | ... | ... | ... |

这对代理的经济潜力意味着什么

非工程师员工对代理工具的更多使用,拓展了这些员工能完成的工作边界。这对企业如何重新设计工作流程、对员工学习哪些技能变得更有价值、以及对政策制定者和研究人员理解AI如何改变劳动力市场都至关重要。

我们的论文展示了前沿用户如何在前沿采用有能力的代理工具。我们的结果揭示了当人们广泛、低门槛地使用有能力的代理工具时会发生什么:随着工具改进,人们将其用于更长周期、更复杂和更跨职能的工作。随着时间的推移,这很可能成为未来工作的样貌。

---

¹ 基于人类完成类似任务所需时间的专家估计。 ² 这些估计来自对Codex在不同任务类别中生成结果的专家评估,并非精确测量。

阅读原文
📚 相关主题 研究职场

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部