📡 X 信号

OpenAI创始人跳槽Anthropic，去用Claude训练下一代Claude

@shanaka86 1.1万浏览 · 63 喜欢 · 30 转推 · 33 收藏 AI商业

最新消息：OpenAI 的联合创始人之一刚刚加入 Anthropic，组建一支利用 Claude 来训练下一代 Claude 的团队。人工智能安全研究人员警告了二十年的那件事，如今已有了负责人、预算和启动日期。安德烈·卡帕西（Andrej Karpathy）于 2026 年 5 月 19 日宣布，他已加入 Nick Joseph 领导下的 Anthropic 预训练团队。

卡帕西是 OpenAI 的创始成员，2017 至 2022 年间担任特斯拉 AI 总监，2023 年曾短暂重返 OpenAI，2024 年初离职创办了一家名为 Eureka Labs 的人工智能教育公司，并开发了多个广为使用的开源项目，包括 nanoGPT、llm.c 和 nanochat，这些项目以极低成本完整展示了预训练全流程。他堪称应用人工智能领域最受尊敬的个人贡献者。他的 X 简介至今仍将他描述为 OpenAI 创始团队成员。

真正关键的是其职位。Nick Joseph 公开表示，卡帕西“正在组建一支专注于利用 Claude 加速预训练研究本身的团队”。这句话中起关键作用的词是“本身”。

当前的 Claude 协助人类设计下一代 Claude。Claude 生成数据整理方案。Claude 迭代超参数。

Claude 调试训练运行。Claude 提出架构变更。一个模型生成的输出，成为下一个模型的方法论输入。

闭环已然闭合。卡帕西近几个月来亲自通过一个名为 autoresearch 的开源项目对这一机制进行了原型验证，其中 AI 智能体迭代自身训练代码。他现正被部署于前沿规模，执行其已在小规模上证明有效的任务。

这正是尼克·博斯特罗姆（Nick Bostrom）在 2014 年《超级智能》（Superintelligence）中所描述的机制。这也是埃利泽·尤德科夫斯基（Eliezer Yudkowsky）撰写了数万页文字论述的内容。递归式自我改进，已成为人工智能安全领域逾二十年来的核心思想实验。

其风险始终在于：一个能力足够强的模型将被用于设计并训练其继任者，从而形成一种复合式循环——每一代模型的诞生速度都快于上一代，而人类监督则日益困难。该机制已不再停留于理论层面。它已成为一家以“安全优先”人工智能开发著称的公司的组织架构图中的一部分。

企业地理格局构成第二重讽刺。达里奥（Dario）与丹妮拉·阿莫迪（Daniela Amodei）于 2021 年创立 Anthropic，正是因为他们认为 OpenAI 在能力发展上推进过快，而安全架构却严重不足。Anthropic 曾是审慎的实验室。

那个认真对待宪法式人工智能（Constitutional AI）的实验室。如今，一家为比 OpenAI 更安全而创立的实验室的创始人，却加入了 Anthropic，去构建安全界早已预警过的系统。要么安全界对危险的判断有误，要么 Anthropic 已得出结论：在一家专注安全的组织内部实施受控递归，是注定将在某处发生的结局中危险性最小的版本。

英伟达（NVIDIA）将于明日发布财报。市场共识预期营收为七百九十亿美元。美国超大规模云厂商已承诺投入七千二百五十亿美元，押注算力即护城河。

在杭州，一家中国实验室据报仅耗资五百六十万美元，便通过蒸馏美国 API 的输出，研制出一款前沿级模型。在旧金山，OpenAI 的一位创始人刚刚走进 Anthropic，开始组建一支让模型自行训练自身的团队。资本位于加州。

算法来自杭州。递归刚刚抵达 Anthropic。明晚我们将得知英伟达的看法。

本文由 AI 翻译自英文原帖，技术名词保留英文。

查看 X 原帖

📬 订阅 AI Pulse