代理型AI如何将知识工作从单次交互转变为委托式长周期任务

📅 2026 年 6 月 25 日 📖 约 6 分钟 OpenAI AI研究职场

代理如何改变工作方式

代理型AI（Agentic AI）将知识工作的基本单位从单次交互转变为委托式的长周期任务。聊天机器人交互往往简短且独立完成，而代理可以独立运行几分钟甚至几小时，同时协调工具调用、与环境交互并迭代逼近解决方案。因此，代理正迅速成为工作中最强大的AI工具。

过去一年，我们在OpenAI内部亲眼目睹了这一转变。在Codex向公众发布后的最初几个月里，ChatGPT仍然是OpenAI内部默认的工作AI工具。截至2025年8月，OpenAI员工平均只有不到10%的token用在Codex上。如今，包括法律和招聘等非技术部门在内的所有部门，都将Codex作为其主要工作AI工具。这一模式反映了我们认为随着代理工具能力和可及性的提升，未来工作将呈现的样貌。

Codex的采用率与其能力同步增长。随着Codex利用更强模型和新产品功能，它能够承担越来越多的生产性任务。在个人用户、组织用户和OpenAI员工三个群体中，我们记录了过去一年的四个趋势：

- 人们使用Codex处理更长周期的工作。 到2026年5月，抽样个人用户中80.6%至少提出过一次估计相当于人类工作超过30分钟的Codex请求，70.2%至少提出过超过一小时的请求，25.6%至少提出过超过八小时的请求。

- Codex成为OpenAI每个部门的主要AI工具。 工程部门率先迁移，但法律、财务和招聘部门在2026年4月左右也转向以Codex为主要AI工具。对于OpenAI员工而言，Codex使用现在占其输出token的85%以上。由于Codex用户往往比非用户使用更多token，其在总token中的占比更高：Codex占OpenAI内部每周输出token的99.8%。

- 非开发者采用率增长尤为迅速，超过了开发者。 自2025年8月以来，个人用户中的非开发者增长了137倍，组织用户增长了189倍，OpenAI内部增长了12倍。

- Codex使OpenAI员工能够完成岗位描述之外的任务。 虽然技术使用在工程师中仍然最为普遍，但非技术用户经常使用Codex进行编码或技术执行，包括自动化、数据转换、工具开发、调试和结构化分析。

代理工作时间更长，任务更困难

近四分之一的Codex请求涉及需要人类超过一小时才能完成的任务¹。随着Codex独立处理长上下文能力的提高，用户从短交互转向更困难、周期更长的任务。下图估算了跨越四个时间阈值的个人用户比例：需要人类超过30分钟、超过一小时、超过四小时和超过八小时的任务²。从2025年12月到2026年5月，提出估计对应人类工作超过30分钟请求的用户比例上升到80.6%。提出超过一小时请求的用户比例上升到70.2%。提出超过八小时工作请求的比例从低基数增长最快。

代理使用的增长可以从每日Codex运行时间中看出。在OpenAI的日活跃用户中，最重度用户要求Codex在一天内运行数小时的代理工作。到2026年6月，第99百分位的用户每天经常生成超过60小时的Codex代理轮次，分布在多个并行代理中。随着Codex变得更强大且可并行化，用户从一次只要求Codex给出一个答案，逐渐转向在一天内编排多个代理任务。

采用率继续从工程师扩展到OpenAI其他部门

OpenAI的工程师率先逐步采用Codex。到2025年12月，公司工程师平均将大部分OpenAI产品使用转移到Codex。如今，工程师平均99%的输出token来自Codex而非ChatGPT。法律、财务和招聘部门较晚（约2026年4月）才将多数使用转向Codex，但转变更为迅速。OpenAI的律师或招聘人员现在平均超过85%的输出token来自Codex。

过去六个月，Codex在OpenAI内部的使用深度和强度都在增加。在活跃内部用户中，各部门的综合输出token变化量急剧上升。研究部门增幅最大：到2026年6月，中位使用量是2025年11月的56倍。客户支持增长32倍，工程增长27倍，而法律增长较缓但仍达到11月水平的13倍。

这两个模式共同说明了Codex如何改变了OpenAI使用AI进行生产性工作的方式。在整个公司，用户正从聊天机器人转向代理作为其主要AI交互形式，并部署呈指数增长的代理劳动力。

非开发者是增长最快的用户群体

在所有用户群体（OpenAI员工、组织用户和个人用户）中，Codex的使用都始于开发者——这很自然，因为Codex最初是作为编码工具。但随着Codex扩展至更通用的知识工作，非开发者的采用率增长更快。如下图所示，在个人、组织和OpenAI员工群体中，每周非开发者用户增长速度均超过开发者。到2026年6月初，自2025年8月以来，非开发者个人用户增长了137倍。非开发者组织用户增长了189倍，而OpenAI内部非开发者用户增长了12倍——可能是因为该群体起点已远高于平均水平。

这种转变并不意味着每个非开发者都以工程师的方式使用Codex。相反，它意味着更多非开发者正在使用Codex进行某种代理工作。

Codex正在拓展潜在生产性工作的边界

Codex使非技术部门能够加速过去因缺乏技术专长而受阻的工作流程。下方的热力图比较了OpenAI内部推断的岗位与Codex输出所代表的工作类型。工程和编码是数据科学与研究部门的最大类别，而知识工作是财务与业务运营、市场营销、运营及其他部门的最大类别。

然而，代理工具可以扩展单个员工的能力范围。例如，业务部门员工使用Codex完成的工作中，超过四分之一是工程或编码任务。代理可以降低跨任务边界的成本，帮助员工完成以往需要更专业技术人员支持的相邻工作。

岗位 vs. 用Codex完成的工作

| 工作类别 | 工程 | 数据科学/研究 | 财务/业务运营 | 产品/市场/运营 | 其他 | |---------|------|-------------|-------------|---------------|------| | 各部门输出token占比 | ... | ... | ... | ... | ... |

这对代理的经济潜力意味着什么

非工程师员工对代理工具的更多使用，拓展了这些员工能完成的工作边界。这对企业如何重新设计工作流程、对员工学习哪些技能变得更有价值、以及对政策制定者和研究人员理解AI如何改变劳动力市场都至关重要。

我们的论文展示了前沿用户如何在前沿采用有能力的代理工具。我们的结果揭示了当人们广泛、低门槛地使用有能力的代理工具时会发生什么：随着工具改进，人们将其用于更长周期、更复杂和更跨职能的工作。随着时间的推移，这很可能成为未来工作的样貌。

---

¹ 基于人类完成类似任务所需时间的专家估计。 ² 这些估计来自对Codex在不同任务类别中生成结果的专家评估，并非精确测量。

阅读原文

📚 相关主题研究职场