AI Pulse
📡 X 信号

OpenAI创始人跳槽Anthropic,去用Claude训练下一代Claude

最新消息:OpenAI 的联合创始人之一刚刚加入 Anthropic,组建一支利用 Claude 来训练下一代 Claude 的团队。人工智能安全研究人员警告了二十年的那件事,如今已有了负责人、预算和启动日期。安德烈·卡帕西(Andrej Karpathy)于 2026 年 5 月 19 日宣布,他已加入 Nick Joseph 领导下的 Anthropic 预训练团队。

卡帕西是 OpenAI 的创始成员,2017 至 2022 年间担任特斯拉 AI 总监,2023 年曾短暂重返 OpenAI,2024 年初离职创办了一家名为 Eureka Labs 的人工智能教育公司,并开发了多个广为使用的开源项目,包括 nanoGPT、llm.c 和 nanochat,这些项目以极低成本完整展示了预训练全流程。他堪称应用人工智能领域最受尊敬的个人贡献者。他的 X 简介至今仍将他描述为 OpenAI 创始团队成员。

真正关键的是其职位。Nick Joseph 公开表示,卡帕西“正在组建一支专注于利用 Claude 加速预训练研究本身的团队”。这句话中起关键作用的词是“本身”。

当前的 Claude 协助人类设计下一代 Claude。Claude 生成数据整理方案。Claude 迭代超参数。

Claude 调试训练运行。Claude 提出架构变更。一个模型生成的输出,成为下一个模型的方法论输入。

闭环已然闭合。卡帕西近几个月来亲自通过一个名为 autoresearch 的开源项目对这一机制进行了原型验证,其中 AI 智能体迭代自身训练代码。他现正被部署于前沿规模,执行其已在小规模上证明有效的任务。

这正是尼克·博斯特罗姆(Nick Bostrom)在 2014 年《超级智能》(Superintelligence)中所描述的机制。这也是埃利泽·尤德科夫斯基(Eliezer Yudkowsky)撰写了数万页文字论述的内容。递归式自我改进,已成为人工智能安全领域逾二十年来的核心思想实验。

其风险始终在于:一个能力足够强的模型将被用于设计并训练其继任者,从而形成一种复合式循环——每一代模型的诞生速度都快于上一代,而人类监督则日益困难。该机制已不再停留于理论层面。它已成为一家以“安全优先”人工智能开发著称的公司的组织架构图中的一部分。

企业地理格局构成第二重讽刺。达里奥(Dario)与丹妮拉·阿莫迪(Daniela Amodei)于 2021 年创立 Anthropic,正是因为他们认为 OpenAI 在能力发展上推进过快,而安全架构却严重不足。Anthropic 曾是审慎的实验室。

那个认真对待宪法式人工智能(Constitutional AI)的实验室。如今,一家为比 OpenAI 更安全而创立的实验室的创始人,却加入了 Anthropic,去构建安全界早已预警过的系统。要么安全界对危险的判断有误,要么 Anthropic 已得出结论:在一家专注安全的组织内部实施受控递归,是注定将在某处发生的结局中危险性最小的版本。

英伟达(NVIDIA)将于明日发布财报。市场共识预期营收为七百九十亿美元。美国超大规模云厂商已承诺投入七千二百五十亿美元,押注算力即护城河。

在杭州,一家中国实验室据报仅耗资五百六十万美元,便通过蒸馏美国 API 的输出,研制出一款前沿级模型。在旧金山,OpenAI 的一位创始人刚刚走进 Anthropic,开始组建一支让模型自行训练自身的团队。资本位于加州。

算法来自杭州。递归刚刚抵达 Anthropic。明晚我们将得知英伟达的看法。

本文由 AI 翻译自英文原帖,技术名词保留英文。

查看 X 原帖

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部