AI Pulse · 2026 年 6 月 17 日

今日焦点

代理编码中专业知识回报持续存在

代理式编码与专业知识的持续回报

### 关键发现在前期工作的基础上，我们引入了一个研究交互式代理编码的框架，对 2025 年 10 月至 2026 年 4 月间约 40 万次 Claude Code 会话进行了隐私保护分析。我们评估了任务构成、人机协作以及成功率。

在典型会话中，人类做出大部分规划决策（做什么），Claude 做出大部分执行决策（怎么做）。一个人带入会话的领域专业知识越多，Claude 每次指令完成的工作就越多。在编码任务上，所有主要职业的成功率——即完成用户设定的目标，并有可验证的证据（如测试通过或代码提交）——平均而言与软件工程师几乎持平。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

AI工具 · @LangChain▲ 1.6K

新推出的LangSmith Fleet，给用户提供两种代理选择

分为通用对话代理和专用任务代理，官方解释了两类代理分别适合什么时候用，目前已经推出

LangSmith Fleet 有两种类型的智能体：✅ 通用对话 ✅ 专业智能体。

@BraceSproul 讲解了我们为什么提供这种选择，以及每种智能体的适用场景。

代理编码中专业知识回报持续存在

代理式编码与专业知识的持续回报

🔥 信号雷达

新推出的LangSmith Fleet，给用户提供两种代理选择

换开源微调模型后，语音代理成本砍了六倍

Deep Agents核心能力有两分钟教程讲透了

测了大模型做游戏：贵十倍的模型做出来差不多

AI能写喜剧的那天，才会迎来通用人工智能？

企业AI现在安稳，可能只是中场休息

端侧级别的大模型，现在开源放到社区了

国产开源大模型GLM-5.2初步表现亮眼

不用写复杂代码，AI Studio直接做安卓APP

要让所有人用上开源强AI，得靠符号学习？

AI从业者探讨大语言模型智能体验证器的重要性

业内观点：开源大模型滞后闭源8-12个月需提前防护

这款大模型居然第一次模拟出了稳定的心智

AI企业现在给编码代理花的钱涨疯了

Codex操控电脑的三种方式，整理好适用场景了

有人给AI行业画了一张双维度发展坐标系

大家都在猜Mistral年底会开源最大模型

Anthropic报告：专家用Claude反而产出更多

现在最大的AI商机，还没多少公司摸透

专门做SpaceX AI项目的工程公司成立了

好文档居然能帮AI agent省这么多成本时间

不用事后加装 AI 智能体治理功能啦

大语言模型智能体能探索看不见的环境吗？

大语言模型智能体能探索看不见的环境吗？

测了大模型做游戏：贵十倍的模型做出来差不多

Anthropic报告：专家用Claude反而产出更多

端侧级别的大模型，现在开源放到社区了

不用事后加装 AI 智能体治理功能啦

专门做SpaceX AI项目的工程公司成立了

这款大模型居然第一次模拟出了稳定的心智

AI企业现在给编码代理花的钱涨疯了

Codex操控电脑的三种方式，整理好适用场景了

新推出的LangSmith Fleet，给用户提供两种代理选择

有人给AI行业画了一张双维度发展坐标系

大家都在猜Mistral年底会开源最大模型

要让所有人用上开源强AI，得靠符号学习？

企业AI现在安稳，可能只是中场休息

AI能写喜剧的那天，才会迎来通用人工智能？

现在最大的AI商机，还没多少公司摸透

国产开源大模型GLM-5.2初步表现亮眼

好文档居然能帮AI agent省这么多成本时间

换开源微调模型后，语音代理成本砍了六倍

不用写复杂代码，AI Studio直接做安卓APP

Deep Agents核心能力有两分钟教程讲透了

业内观点：开源大模型滞后闭源8-12个月需提前防护

AI从业者探讨大语言模型智能体验证器的重要性

📖 深度解读

代理编码中专业知识回报持续存在

模拟部署：在模型发布前预测其真实行为

AI客服语音延迟压至400毫秒 成本直降六分之一

Kimi K2.7 Code 与 Claude Opus 4.8 的效率之争令人震惊

📬 订阅 AI Pulse

AI客服语音延迟压至400毫秒成本直降六分之一