AI Pulse

Anthropic经济指数报告:AI使用的日常节奏与劳动力市场影响

Anthropic经济指数报告:AI使用的日常节奏与劳动力市场影响

Anthropic经济指数报告:节奏

### 引言
一年前,大多数Claude的使用场景是用户与助手之间的对话。随着Claude Code和Cowork的快速增长,Claude会话现在越来越多地涉及长时间运行的任务自动化。聊天记录已无法完全捕捉人们使用AI的方式,我们研究Claude经济影响的方法也必须随之调整。

为了跟上步伐,我们对经济指数的数据管道进行了几项修改。在此版本中,我们:
- 以更高的频率采样数据,使我们能够观察到每小时级别的使用模式。
- 引入了一个新的分类器,用于标记每次会话的输出。
- 共享更细粒度的数据,按月度汇总,分别展示聊天和Cowork会话(统称“Claude会话”)以及1P API的结果。¹

我们在附录中描述了其他方法变更。这些变化共同提供了更清晰的图景,展示AI如何反映并融入经济生活。

此外,我们之前缺乏对用户会话之外Claude影响的可见性。人们如何看待AI正在改变他们的工作或他们可获得的机会?他们使用AI是否塑造了他们的期望?在理想情况下,他们希望从AI中得到什么?我们报告了2026年4月启动的Anthropic经济指数调查的初步结果。

我们预览主要发现如下。

在第一章中,我们展示了外部世界的节奏如何塑造Claude的使用。与工作相关的查询在周末减少,尽管在收入最高的职业中减少幅度较小;人们倾向于在早上询问新闻,而睡眠建议在凌晨5点左右达到高峰;与税务相关的请求在报税截止日期前后激增。

第二章探讨了人们从Claude会话中获取的具体输出。这些输出高度依赖于他们使用的产品。例如,聊天和Cowork提供的解释比Claude Code更多。输出的性质也塑造了人们与Claude的互动。构建网站比翻译文档更多地依赖Claude的判断,因为在翻译中答案很大程度上由文本决定。我们还发现,更多的计算资源与更有价值的产出相关;给定输出消耗的token数量随工作估计价值的增加而增加。

第三章展示了Anthropic经济指数调查的首批结果,我们通过隐私保护系统将其与Claude使用数据关联。期望和体验与人们使用Claude的方式系统性地相关:以最自动化方式使用Claude的人预计AI将在未来一年承担更多任务,但同时对这对其工作的意义感到最乐观,预计对薪酬、工作保障和意义产生积极影响。

第一章:日常节奏

我们新的隐私保护遥测技术每天连续采样一部分会话,使我们能够研究每日和每小时的使用模式,而此前每份经济指数报告使用的是七天样本。这些分析捕捉了全球工作模式的潮起潮落。²

我们发现Claude使用反映了工作周,个人提示在周末激增。每小时数据捕捉了一天中的模式——人们最常在凌晨5点左右询问睡眠建议,在下午6点左右询问食谱。我们还看到使用情况反映了关键日期。例如,在美国报税截止日期4月15日之前,与税务相关的请求激增。

#### 工作周

在样本期间,聊天和Cowork³会话中被归类为个人使用的比例从工作日的约35%激增至周末的近50%(图1.1)。在非工作周,用户的对话从商务信函、营销文案和幻灯片转向情感支持、医学问题和投资建议。这种转变在高收入国家最为明显。

图1.1:周末个人会话增加
每日个人使用会话在Claude.ai、Claude Desktop、Claude Code和1P API中的占比。周六和周日以灰色阴影显示。

Claude Code和1P API流量(即直接通过Anthropic路由的API流量)也存在类似模式,尽管两者的个人使用基线率较低。⁴

请求聚类⁵使我们能够深入一层,查看哪些特定的Claude Code任务在周末和工作日之间波动最大。在周末,Claude Code使用聚类中下降最多的包括后端架构、API调试和数据存储。上升最多的包括AI代理设计、量化交易和游戏。

周末也可能为人们创造追求新事业的空间。在各国中,与创业相关的会话在周六和周日最高。然而,求职申请活动在周末随其他工作任务一起下降。⁶

#### 日常节奏

按小时计算,Claude使用反映了日常生活的节奏。图1.2显示不同请求聚类在本地时间每小时的出现频率相对于其在全球流量中的总体平均值。⁷

人们在早上7点询问新闻。商务信函(例如起草电子邮件)描绘了工作日的轨迹,在上午10-11点略有高峰。最大的高峰之一是食谱请求,在下午6点的频率是平均值的2.3倍。媒体推荐最集中在晚上,而人们在黎明前几小时寻求睡眠建议。

图1.2:一天中不同时间段的请求聚类
归一化后各请求聚类会话的每小时占比,仅限于Claude聊天和Cowork数据。

在夜间和周末,当人们确实使用Claude工作时,任务偏向于高薪职业(图1.3)。虽然我们无法确切识别提出这些请求的人的工作,但这可能反映了高薪职业的人——如营销经理或计算机程序员——更可能在传统工作时间之外工作。相比之下,与收入最低两个四分位数的职业相关的任务——如电话销售和文员工作——在总会话中的占比下降。这种模式并非完全由计算机和数学任务驱动:当我们进行稳健性检验排除这些职业后,较高四分位数任务在夜间和周末仍然增加。

图1.3:夜间和周末工作相关会话份额的变化,按职业工资四分位数划分
每个柱状图显示指定工资四分位数的任务在夜间和周末相对于工作日工作时间的份额百分比变化。工资四分位数使用BLS数据,按转录本数量加权计算。

#### 报税日

本报告样本期涵盖了美国人的报税截止日期。图1.4显示在截止日期前后,与税务相关的会话比例大幅飙升。4月14日,税务相关聚类的出现频率是5月平均日期的8倍,并在4月15日保持类似高位。4月16日,它们急剧下降。

图1.4:美国报税截止日期前税务相关会话激增
美国和世界其他地区与税务相关会话的占比。

第二章:输出物

在本章中,我们根据输出物对聊天和Cowork(以下简称“Claude会话”)⁸中的每次会话进行分类,将其归入30多个类别。我们将Claude在会话中产生的主要输出——文档、解释、一段代码、学术论文等,无论是显示在聊天窗口中还是作为单独文档——称为输出物。完整输出物列表见附录。

我们的分类器识别出93%的Claude会话产生了一个输出物(图2.1)。⁹最常见的输出物是解释(占会话的17%)、文档和报告(15%)以及指导(11%)。对话式输出(如解释或指导)和书面交付物(如文档或演示文稿)各约占会话的三分之一;代码和技术工作(如应用程序或脚本)约占六分之一。

图2.1:Claude的输出物
具有特定输出的会话占比。图中显示了Claude会话中最常见的十二种输出类型。1P API的混合情况见附录。

输出物是什么并不能说明其用途:同一个输出物可能是工作交付物或个人项目。我们接下来关注这种区分。

#### 每种输出物用于什么?

我们1月份的经济指数引入了一个原语,将每次会话分类为工作、个人或课程作业。这里,我们将其应用于Claude会话中产生的输出物(图2.2)。

某些类别的输出物几乎总是个人用途。超过80%的产生创意写作、指导和食谱的会话被归类为个人用途。在这些类别中,个人用途和工作用途可能看起来截然不同。例如,个人创意写作主要由同人小说、世界构建和诗歌主导;13%的工作相关用途主要是短视频脚本、编剧和演讲稿。最可能属于工作相关的类别包括创建营销内容(80%)、创建博客或文章(81%)以及编写数据库查询(82%)。

许多输出物同样可能用于个人或工作原因,包括创建计划或策略(44%工作相关,49%个人)或翻译(42%工作,44%个人)。例如,最常见的个人计划输出物包括旅行计划和锻炼计划,而工作相关计划通常涉及创业或内容策略。

最后,课程作业特有的输出物包括创建学术论文和学位论文、教育材料以及与数学相关的查询,尽管其中每种都有一定比例同时属于工作和个人类别。

图2.2:按用例划分的输出物份额
按工作、个人和课程作业分类的具有特定输出的会话占比。

我们也可以反过来提问。与其问每种输出物用于什么,不如问工作、个人和课程作业会话各自倾向于产生何种输出物。工作会话最常产生文档和报告(20%),其次是解释(9%)、电子邮件草稿(7%)以及分析和总结(6%)。课程作业会话大致相似,文档和报告也占主导(21%),紧随其后的是解释(20%)、教育材料(11%)和学术论文(6%)。相比之下——不足为奇——只有6%的个人会话产生文档。相反,最常见的结果是解释(25%)和建议(22%)。

#### 成本与工作价值相关

产生这些输出需要计算资源,我们发现计算资源往往随工作价值增加而增加。我们以token(处理和生成的文本量,包括Claude的内部推理)衡量每次会话的计算成本,并通过将会话分类任务映射到通常执行该任务的职业,在不同职业之间进行比较。在本节中,我们仅分析工作相关会话。

图2.3的左面板显示了会话级别token中位数与映射职业工资中位数之间的正相关关系。¹⁰例如,营销经理的收入大约是编辑的两倍(每小时80美元对37美元),而映射到他们任务的会话消耗的token大约是后者的2.5倍。诚然,这种关系存在噪声,并且有显著的异常值。例如,药剂师的收入几乎是统计助理的三倍(每小时68美元对24美元),但映射到药剂师任务的会话使用的token仅约为后者的二十分之一。

图2.3:高薪职业的会话消耗更多token
左面板:特定职业的工资中位数与属于该职业任务的会话典型(几何平均)token数量之间的关系,按整体均值归一化。两个变量均以对数刻度显示。右面板:生成特定输出物所用token的分布。黑线表示中位数,方框表示第25和75百分位数,须线表示第10和90百分位数。所有数字均按整体token中位数归一化,并以对数刻度显示。两个面板的数据均限于聊天和Cowork,且仅限于分类为工作相关的会话。token数量未根据服务会话的模型进行调整。

生成不同类型输出物所消耗的token也呈现类似情况。更复杂和更有价值的输出物往往消耗的token显著多于更简单的输出物。例如,关于构建应用程序的会话使用的token数量是中位数会话的三倍以上。而在另一端,典型的解释仅使用中位数会话约五分之一的token。token消耗的工资梯度中约有44%可由输出物组合解释——高薪职业更有可能产生计算密集型输出物。

为什么这在经济上很重要?在映射到高薪职业的会话中,Claude每次轮换产生更多输出(1.34倍),而用户参与更多轮次(1.53倍),并且更频繁地启用扩展思维(34%的会话对比31%;表2.4)。至关重要的是,这些方面同时增加:Claude产生更多输出并不意味着用户贡献减少。如果人类仍然参与最高价值的任务,这种模式看起来更像是劳动增强而非劳动替代。它还表明,在某种程度上,更有价值的产出成本更高。下一节将研究每次会话中有多少决策被委托给Claude。

表2.4:高薪职业中token消耗更高的原因
在映射到高薪职业的会话中,导致token消耗更高的会话特征。职业根据其中位工资分为三分位数,并按匹配到每个职业的会话数量加权。计算相关度量按其底部三分位数组的几何均值归一化。例如,第一行显示,典型顶级三分位数职业的会话消耗的token是典型底部三分位数职业的2.07倍。

#### Claude有多大自主权自行决定?

我们以1-5的等级衡量,从“无”到“极高”。易于描述或指定的任务涉及很少自主权:自主权最低的输出物包括数学或计算、翻译以及问答。高自主权任务是那些需要在许多可能选择中做出选择的任务,例如创建应用程序和网站、游戏或演示文稿。这类需要持续判断的工作历来难以自动化。通过比较Claude聊天和Cowork与Claude Code中的自主权水平,我们表明这种情况正在开始改变。

在几乎所有类型的输出物中(31个输出物中的26个),Claude Code中的AI自主权水平高于聊天或Cowork。¹¹例如,产生脚本和代码片段的会话在使用Claude Code时平均自主权高出0.53分(在1-5等级上),而聊天或Cowork产生相同输出物的会话则较低。在所有会话中,平均自主权差异为0.37分,有两个主要来源。¹²

大约三分之二的差异可归因于相同任务在Claude Code上以更多委托的方式执行。博客文章和文章说明了这一点:两种界面上的请求和任务相似,但人们与Claude合作的方式截然不同。产生博客文章或文章的聊天和Cowork会话中位数涉及13轮来回互动,而产生博客的Claude Code会话中位数仅包含一个人类提示。剩余的三分之一反映了两种界面之间输出物组合的不同。

图2.5:按输出类型划分的AI自主权
按会话输出及界面划分的平均AI自主权水平。AI自主权以1-5等级从“无”到“极高”评定。

有人可能怀疑这一差异仅仅反映了模型选择。Claude Code会话使用最强大模型的频率远高于其他(54%由Opus服务,而聊天和Cowork会话仅为10%)。然而,当我们比较由同一模型服务的会话时,差距仍然存在。例如,在使用Sonnet的会话中,Claude Code会话的自主权仍然高出0.26分,这表明所使用的产品可能比底层模型更重要。

从界面比较的角度退一步来看,用户委托最多的输出类型正是消耗计算资源最多的类型:跨各输出物,平均自主权与中位数token使用量同时上升(聊天和Cowork上r = 0.68;附录图A.2)。

#### Claude的回答水平高于提问水平

对于每次会话,分类器会估计两个阅读水平——一个用于用户提示,一个用于Claude的响应——表示为理解文本所需的教育年限。¹³我们发现阅读水平因输出物类型而异并差异很大。产生学术论文的平均查询需要超过16年的教育,大致相当于学士水平,并且这些会话中有15%达到博士水平或以上(20年或更多教育)。而在光谱的另一端,产生食谱或指导的会话中,理解提示所需的教育年限少于10年。

总体而言,阅读水平较高的输出物类型也对应阅读水平较高的提示(会话间的相关性为0.87)。然而,我们也观察到,在几乎每个类别中,Claude输出的理解水平都高于提示,平均高出约一年教育年限。差距最大的地方是用户描述要构建的内容,如图像和图形(+2.6年)、游戏(+1.9年)以及应用程序和网站(+1.7)。部分差距可能仅仅是语域造成的;提示通常简洁随意,而Claude倾向于以文雅的散文回应。然而,对于面向受众的写作(博客-0.1,学术论文+0.0,电子邮件+0.3),差距接近于零,这可能是因为提示通常草拟了与预期输出相同语域的语言或源材料。

图2.6:用户提示与Claude响应的阅读水平,按输出物划分
理解用户提示和Claude响应所需教育年限的估计值。仅限于聊天和Cowork。

第三章:认知

前两章展示了人们如何使用Claude,但没有深入了解人们在工作中体验AI的方式——他们如何预期工作和职场会改变,他们对AI当前及潜在影响的感受,以及他们对这项技术的希望。我们于2025年12月使用Anthropic Interviewer对81,000名Claude用户进行的采访描绘了一幅图景:受访者报告了巨大的生产力提升,但也表达了对岗位替代的担忧。这些担忧集中在早期职业工作者以及我们观察到Claude做最多工作的职业中。¹⁴

2026年4月,我们启动了Anthropic经济指数调查,以在此基础上进一步研究。该调查使我们能够直接询问人们关于AI与工作的体验,并探索其与Claude使用情况的关系。我们使用隐私保护方法将调查回复与5月中旬至6月初的使用数据相关联。为了描述每个受访者的使用模式,我们在此时间窗口内随机抽取每人最多20次会话(涵盖Claude.ai、Cowork和Claude Code,以便会话组合反映每个人在不同界面上的典型使用情况)。我们排除会话少于5次的受访者以减少抽样噪声。最终关联样本包含约9,700名调查受访者。

我们发现大多数受访者预计AI在未来一年将取得重大进展。虽然人们对AI能力的感知取决于其经验、居住地以及其工作暴露于AI的程度,但他们关于未来进步速度的预期惊人地一致,这与“水涨船高”的说法一致,即AI能力将广泛提升。

关于这种进步对其职业生涯意味着什么的看法则不那么一致。早期职业工作者报告称AI可以完成他们工作中最大比例的任务,并对失业表达了最多担忧。然而——与一种常见担忧相反——最常委托给Claude的人对自己未来的劳动力市场结果最为乐观,并感觉自己的技能价值在增长。而且,尽管(或许正因为)他们接近AI的前沿,一般受访者对未来十年的希望并非替代,而是合作。他们希望AI能够保留有意义的工作,自动化枯燥的任务,并且AI带来的收益能够广泛分享。

#### 谁回应了经济指数调查

经济指数调查并不代表总体人口。我们覆盖了Claude用户的随机样本,但可能存在完成调查的选择偏差,并且我们在分析中过滤掉了不频繁用户。图3.1显示了调查受访者的职业构成(橙色)与美国就业情况(灰色)。计算机和数学职业被过度代表最为严重,约占受访者的30%——与其在Claude使用中的份额相当,但远高于其在美国就业中4%的份额。管理层占受访者的23%¹⁵,相对于其7%的就业份额也被严重过度代表,尽管其仅占会话的4%。这一差距与管理层人员将Claude用于管理本身以外的任务是一致的:在调查中,判断和管理被许多受访者(尤其是有更多经验的人)认为是AI缺乏的能力。体力职业类别,如运输与物料搬运、食品制备与餐饮服务、建筑与开采,在调查中代表不足,正如它们在Claude会话中一样。

图3.1:调查受访者相对于美国就业严重偏向计算机与数学以及管理职业
调查受访者在22个主要SOC组¹⁶中报告其职业的占比,与OEWS中每个职业在美国就业中的占比对比。

#### AI与工作任务

关于AI影响的研究通常关注职业暴露度,即给定工作中可用AI完成的任务比例。在先前的工作中,我们构建了一个观察暴露度指标,捕捉我们已经看到用Claude完成的职业任务比例。我们将其与一个常用的理论暴露度指标进行了比较,即大型语言模型理论上可以完成的职业任务比例。

了解职业暴露度的另一种方法是直接询问人们AI能够完成他们工作的多少。我们询问受访者AI今天可以完全自行完成他们工作任务的占比(以下称报告暴露度),以及他们预计12个月后AI能处理的占比(预期暴露度),并提供从“几乎无”到“几乎全部”五个选项。接近6成的受访者选择了明年比今天更高的档位。超过三分之一的人预计AI明年能够完成他们大部分或几乎所有工作任务(图3.2)。

图3.2:大多数受访者预计AI能完成的工作任务份额在未来12个月内增长
该图显示了受访者认为AI今天能完成与12个月后能完成的工作任务份额的分布。

图3.3将报告暴露度和预期暴露度与观察暴露度和理论暴露度进行比较。我们询问人们报告和预期的AI能力是否与跨职业的观察和理论暴露度指标一致,以及其职业在观察或理论暴露度上得分较高的受访者是否预期明年有更快的进展。对于第一个问题,答案是肯定的:报告暴露度(灰点)与观察和理论暴露度均呈正相关。对于第二个问题,答案是否定的:报告暴露度和12个月后的预期暴露度(橙点)的最佳拟合线基本平行,这意味着在观察或理论暴露度高和低的角色中,人们预计明年AI能完成的工作任务份额增长大致相同。¹⁷换句话说,软件工程师和建筑经理预计各自职业的进步幅度大致相同。

还值得注意的是,报告暴露度系统性地高于观察暴露度。对此的一个解释是,并非每个职业中的每个人都完成所有任务,而我们的调查不成比例地覆盖了那些更常使用AI的人。¹⁸类似地,由于理论暴露度是可能的理论上限而非当前使用量的度量,理论暴露度系统性地高于报告暴露度。

图3.3:报告和预期暴露度与其他指标比较
人们认为AI今天能完成的任务份额(报告暴露度,灰色)和12个月后能完成的任务份额(预期暴露度,橙色)与观察暴露度(左面板)和理论暴露度(右面板)的对比。每个点代表一个职业,样本量小的职业与暴露度相近的职业合并以确保隐私。报告和预期暴露度计算为调查受访者选择区间的中点。

我们还考察了对AI当前和未来能力的认知如何与受访者的特征和使用模式相关。图3.4的左面板显示,对AI能力的认知与国家GDP呈负相关:¹⁹在高收入国家,人们报告AI现在能为他们完成的任务平均份额约低10个百分点。这种模式与一种可能性一致,即AI替代了低收入国家工人日常工作中更大份额的任务,即使职业层面暴露度指标(在发达经济体中往往更高)表明相反。的确,国际货币基金组织指出,尽管发达经济体整体上面临更广泛的AI暴露度,但低收入国家的工人可能较难获得互补技能和基础设施,这些技能和基础设施使AI能够增强而非替代他们的工作。在早期工作中,我们记录了低收入经济体即使在调整任务组合差异后也倾向于以更自动化的方式使用Claude。

中间面板显示,报告和预期暴露度也与工作经验年限呈负相关。²⁰至少有15年经验的人认为AI能完成的任务份额比刚工作第一年的人约低10个百分点。我们发现证据表明,这可能是因为有经验的工人积累了难以被AI模仿的隐性或特定情境的专业知识。在后续问题中,我们询问人们哪些任务他们认为AI永远无法完成以及原因;最常见的回答强调AI缺乏其工作所需的判断力、情境意识和情境推理。受访者,尤其是那些至少15年经验的人,还指出他们工作中的人际关系维度——建立信任和管理人员——是AI无法复制的。

与职业暴露于AI的情况类似,我们发现关于AI能力未来提升的认知与人均GDP和工作经验年数基本不相关。预计12个月后AI能完成的任务份额普遍高于对AI今天能力的认知。

图3.4:报告和预期暴露度在高GDP国家和有经验的工人中较低,且随自动化Claude使用而升高
报告和预期(12个月)暴露度与每个工作年龄成年人GDP(左)、工作经验年限(中)以及自动化Claude会话占比(右)的关系。

接下来,我们考察人们与Claude互动的方式与其对Claude当前能力的认知之间的关系。与过去的报告一样,我们区分与Claude合作的“自动化”和“增强”模式。当要求Claude在几乎没有用户输入的情况下完成任务时,我们将会话标识为自动化。具体地,自动化份额是指会话模式为指令式(“翻译这份文档”)或反馈循环(“编辑这封电子邮件……让它更随意”)的会话占比。²¹

图3.4的右面板显示,报告和预期暴露度随自动化份额上升而升高。这可能是因为委托行为揭示了能力——将整个任务交给AI的人直接观察到AI能独立完成什么——或者因为已经相信AI能做其工作的人最愿意将其委托给AI。当我们将自动化份额替换为用于工作任务的会话占比或在Claude Code中进行的会话占比时,同样的模式仍然成立。²²

#### AI与工作

我们还询问人们认为自己的工作在未来12个月会如何变化。超过三分之一的受访者表示,职责很可能或非常可能发生重大变化(对他们自己、同事、初级同事和高级同事均如此)。10%的人认为失去自己工作的可能性为很可能或非常可能。这略低于美国年度化失业风险率;²³然而,由于我们的受访者偏向于稳定就业的知识工作者(这一群体在基线情况下更可能面临低于平均的离职风险),这可能仍表明感知风险有所升高。当被问及是什么驱动了他们的预测时,将失业评为很可能或非常可能的人中有38%将其归因于AI。²⁴值得注意的是,受访者平均而言更担心他人而非自己失业。²⁵受访者尤其担心其初级同事的失业,超过三分之一的人称初级同事在接下来一年失业的概率超过60%。受访者还对低收入国家的失业(对所有人)更为担忧。

图3.5:认为接下来一年工作职责将显著改变或个人将非自愿失业的可能性为很可能或非常可能的人占比
分别对自己、同事、初级同事和高级同事报告职责改变(左面板)或个人将失去他们想要保留的工作(右面板)为很可能或非常可能的受访者占比。

以更自动化方式使用Claude的人是否也更担心失业?我们考察了人们对AI在未来一年对工作六个维度预期影响的看法:薪酬、工作保障、找新工作的能力(经济维度)以及意义、自主权和人际互动(内在维度);并观察这些期望如何随Claude使用的自动化份额而变化。

在所有六个维度上,自动化会话份额较高的人比以增强方式使用Claude的人对AI对明年工作结果的影响更乐观。我们在对未来薪酬和找新工作能力的正面影响预期上看到了最大效应。²⁶

图3.6:对AI对工作质量和内在维度的正面预期影响报告占比更高的用户,其Claude使用的自动化程度也更高
该图显示了线性回归的系数估计值,回归将一个人是否预期AI对工作质量的六个维度产生正面影响的指标对归一化的AI自动化份额进行回归。

一个自然的问题是为什么自动化使用和情绪同步变化。可能这种关系是由选择性解释的,即对AI最热情的人也最愿意将整个任务交给它。我们不能完全排除这一点,但当我们控制用户在Claude.ai上的使用时长——这可以作为热情的代理,因为它捕捉了早期采用者与后期采用者——这些估计没有实质变化。

另一种可能性是,以更自动化方式使用AI的人今天体验到了更多好处。与我们先前的研究结果一致,大多数人称AI提高了他们工作的速度、范围和质量(分别为86%、82%和69%),而27%的人报告通过节省他们原本需要购买服务的成本而获益。

除了显著的生产力提升外,大多数人还报告使用AI学到更多(68%),并且感觉AI使他们的技能更有价值(57%)。图3.7显示了这两个结果如何随自动化会话份额变化。我们看到,报告AI增加其技能市场价值的人比例随自动化份额上升,而报告学到更多的人比例大致持平。

一个常见关于委托的担忧是,将整个任务交给AI意味着卸载思考,产出增加以学习和技能退化为代价。我们在这里没有看到这种模式:委托较重的用户报告的学习率与其他所有人相同。然而,这些都是自我评估,技能可能即使在其变得更有价值且某人报告学到更多时也在退化,因此数据不能排除技能退化。

图3.7:报告AI提高技能市场价值的人比例随自动化份额上升,而报告学到更多的人比例持平
该图显示了任务自动化份额与报告AI增加其技能市场价值的人比例(蓝色)以及使用AI时学到更多的人比例(橙色)之间的关系。

#### 性别间的使用差异

到目前为止,我们探讨了使用模式如何与期望和行为相关联。接下来,我们研究谁以各种方式使用Claude。最显著的差异是性别差异。女性,在关联样本中仅占12%,使用Claude的方式与男性不同。即使在考虑职业差异后,她们使用Claude进行工作的可能性略低,在Claude Code中的会话份额低0.24个标准差(6.3个百分点),自动化份额低0.33个标准差(7.3个百分点)。相反,女性倾向于更迭代地使用Claude,并且她们在聊天中的活跃时间多于男性,这是更具协作性参与的信号。²⁷

图3.8:即使在控制职业差异后,女性也呈现出明显不同的使用模式
该图显示了女性与男性使用模式的比较。每个柱状图是女性与男性在该使用度量上的平均值差异,控制职业(SOC小类),以结果的标准差表示。须线显示95%置信区间。样本仅限于自认为女性或男性的受访者。女性的Claude Code和自动化份额显著较低,而总活跃分钟数则较高。

#### 人们对AI转型经济有何期望?

Anthropic经济指数调查呈现了关于AI的积极和消极体验及感受的混合,但我们在一个充满希望的音符中结束调查。最后一个开放式问题要求受访者“大胆梦想:你希望十年后由AI塑造的经济是什么样子?”我们通过一个分类器运行了每次调查回复,该分类器标记了回复中的相关主题。下图展示了最常被引用的前五个主题。每个主题的附加描述见附录。

图3.9:人们希望人机协作、枯燥工作自动化和更多自由时间,以及AI的经济收益广泛共享
该图显示了人们对十年后AI转型经济的希望这个开放式问题回复中最常见的五个主题。

最常见的主题是AI增强工作。超过一半的受访者表达了某种形式的希望与AI合作从事有意义的工作,希望他们的职业仍然重要,和/或希望新产业出现并创造新的就业机会。同时,略超过一半的受访者希望AI自动化——特别是他们工作中乏味的部分——以便他们能有更多自由时间和更多在业余时间寻找意义的空间。第三大常见主题,由约三分之一的受访者表达,是共同繁荣:希望AI的经济收益得到广泛共享。

讨论

AI正在迅速扩散到整个经济中,跨越越来越多的表面,产出越来越智能。在早期的AI聊天界面中,使用是简单的,局限于没有网络搜索、工具调用、输出物或其他功能的聊天窗口。现在,Claude模型可以通过Claude Code和Cowork自主运行数小时。随着这些形式的变化,用户基础也在变化。早期采用者具有很强的技术背景。我们最新的用户将Claude应用于劳动力市场上工资较低的任务。

在本报告中,我们采取了若干措施,以提供更具信息量的衡量。首先,我们开始更频繁地测量和处理数据,以小时样本为单位。这揭示了日常生活的节奏如何刻在我们的使用日志中,并为未来研究开辟了途径。其次,我们开始记录输出物,即人们从Claude中带走的成果。这使Claude的工作产出更加清晰,并显示了一些直观的模式。

最后,使用数据只能包含有限的信息。我们的调查使我们首次能够直接询问人们如何使用AI以及他们对AI的感受。我们发现,我们的调查受访者对AI的使用超出了我们的预期——他们报告AI能完成其工作的份额高于其职业的观察暴露度指标所显示的水平。当被问及对未来一年能力的预测时,超过35%的人预测AI将能够完成他们大部分工作。

准确分类Claude所做的工作仍然是一个移动的目标。例如,随着AI能力的提升,AI可能越来越多地相互交互和交流,也许是以人类或简单分类器难以理解的方式。最终,Claude对经济的影响将在就业和生产率等经济总量中显现,而非仅在其使用日志中。尽管如此,AI很可能在其做最多工作的领域产生最早的影响,因此揭示这些不断变化的使用模式仍然是告知公众的关键方式。

附录
可在此处获取。

引用
@online{anthropic2026aeiv6,
author = {Maxim Massenkoff and Eva Lyubich and Szymon Sacher and Zoe Hitzig and Shaoyi Zhang and Ryan Heller and Peter McCrory},
title = {Anthropic Economic Index report: Cadences},
date = {2026-06-26},
year = {2026},
url = {https://www.anthropic.com/research/economic-index-june-2026-report},
}
Maxim Massenkoff, Eva Lyubich, Szymon Sacher, Zoe Hitzig, Shaoyi Zhang, Ryan Heller, Peter McCrory.

致谢
Scott Booth, Keir Bradwell, Meredith Callan, Dexter Callender III, Boris Cherny, Chris Doenlen, Eleanor Dorfman, Jake Eaton, Evan Frondorf, Deep Ganguli, Romello Goodman, Ankit Gupta, Kunal Handa, Rebecca Hiscott, Andrew Ho, Hanah Ho, Jerry Hong, Saffron Huang, Mo Julapalli, Katie Kennedy, Jennifer Martinez, Miles McCain, Kelsey Nanan, Tyler Neylon, Adnan Pirzada, Dianne Penn, Kerry Persen, Sarah Pollack, Ankur Rathi, Santi Ruiz, David Saunders, Ankit Siva, Michael Stern, Ami Vora, Scott White, Heather Whitney, Kim Withee, Ryan Zauk, Jack Clark.

阅读原文

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部