AI Pulse · 2026 年 7 月 1 日

今日焦点

Anthropic新模型能自主跑完多步骤任务，价格更低

Anthropic 发布了 Claude Sonnet 5，定位为更强的中型模型。和之前的聊天式AI不同，它能自己做规划、用浏览器和终端等工具，很少需要人工干预——几个月前这种水平还得靠更大更贵的模型。

Zapier 的工程师用了一个真实场景：先更新 Salesforce 账户层级，再向企业联系人发发布通知。Sonnet 5 把这个两步任务从头做到了尾，之前的模型会在半路卡住。简单说，你交给它一个多步骤流程——比如更新客户记录后自动发邮件——它现在能自己跑完。

性能上，Sonnet 5 接近旗舰 Opus 4.8，但成本低很多。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 47

Claude Code 被曝藏了类似间谍软件的隐藏代码

有开发者在 Hacker News 爆料这一情况，目前正在社区发酵。正在使用 Claude Code 的人可以留意后续进展

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 43

Claude 桌面端终于出 Linux 测试版了

用 Linux 系统的人不用再靠网页版迂回使用 Claude，现在可以直接用桌面客户端。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 88

人类语言是意识的副产品，大模型正好反过来？

这个观点在Hacker News引发讨论，帮我们重新理解大模型生成文字的底层逻辑和人类的区别。

社区讨论：多数人认同人类语言是意识的副产品，认为人们先产生想法，再寻找合适的词语表达，词语只是思想的外衣。有人以海伦·凯勒自述为例提出反对，指出语言出现前不存在清晰的自我意识，意识反而可能以语言为前提。也有人质疑“意识存在”本身，认为它是人类捏造的概念，未来可能像“以太”一样被抛弃，还有人指出原观点缺乏已有研究支撑，属于主观臆断。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 1.4K

Claude Code 正在用隐写术标记用户请求

有人发现了这个隐藏的标记方式，这件事牵扯出AI开发工具对用户行为的隐秘追踪

社区讨论：多数开发者认为Anthropic未透明披露隐写标记行为，这种做法不合规，商业需求不能为隐瞒辩护。有人认为原博文结论反应过度，这个标记只是用来识别模型蒸馏行为，不会惩罚普通开发者。也有人指出这次实现非常粗糙笨拙，有更隐蔽的技术手段可以实现同样目的。

部分用户因此改用开源替代工具，担心Anthropic会基于标记对用户进行限流或降级处理。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 38

有人放出了Claude Sonnet 5的基准测试结果

新模型的基准测试结果提前流出，能提前看到新一代模型能力的参考数据

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 345

Hacker News热帖Claude Science引大量讨论

已有大量用户参与讨论这个项目，可跟进后续具体信息公开

社区讨论：多数参与者澄清，Claude Science实际定位是面向数据科学的工具，而非通用科研工具，它集成了多个生命科学领域数据库，支持本地服务器运行适配药企涉密数据环境。有前Anthropic从业者指出它的能力不止绘图和写论文，但也有用户质疑它会助长水论文风气，还会 hallucinate 参考文献，当前的功能集成也只覆盖生命科学缺了计算机领域。还有用户不满Anthropic搁置旧产品Fable不更新，却推新产品。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 840

Claude Sonnet 5 突然在Hacker News曝光

只放出了版本名称，没有更多细节，需要等待官方发布更多信息。

社区讨论：多数开发者认为，Claude Sonnet 5中高努力水平的单任务成本已经超过Opus 4.8，性能却更差，价格性价比甚至不如GLM 5.2，没有更换使用的理由。也有长期用Sonnet处理日常编码任务的开发者认为它是不错的增量更新，拆分任务后能以更低成本获得接近Opus的质量。有用户实测指出它达到GLM-5.2水平，速度快一倍但成本也高一倍，在常识、工具调用、谜题解答上存在明显短板。

在 HN 看讨论 ↗ 原文 / 论文 ↗

深度观点 · @OpenAIDevs▲ 6.3万

当AI代理接手长期工作后，工程师要做什么？

当AI代理接手长期工作后，工程师的工作转向设定方向、审核产出，围绕模型设计更好的系统。

随着智能体接手更长周期的工作，工程工作重心转向设定方向、审核工作成果，以及围绕模型设计更完善的系统。

@steipete 发布于 @aiDotEngineer

Anthropic新模型能自主跑完多步骤任务，价格更低

🔥 信号雷达

Claude Code 被曝藏了类似间谍软件的隐藏代码

Claude 桌面端终于出 Linux 测试版了

人类语言是意识的副产品，大模型正好反过来？

Claude Code 正在用隐写术标记用户请求

有人放出了Claude Sonnet 5的基准测试结果

Hacker News热帖Claude Science引大量讨论

Claude Sonnet 5 突然在Hacker News曝光

当AI代理接手长期工作后，工程师要做什么？

Google发布了能用自然语言编辑视频的新模型

顶级资管桥水用自身经验微调了专属AI模型

OpenAI推出新测试基准，专门测AI处理生物数据

业内人士谈Anthropic Sonnet 5：实际表现优于基准测试

Claude Fable 5 出口管制限制正式解除了

Claude Code 价格直接涨成原来的五倍

你听说吗？AI大模型自己长出了类似人脑的功能分区

Anthropic发布了新一代Claude模型，号称目前最好的日常AI

AI做维基记忆最难的一步，居然是压缩信息

给AI智能体开放写代码能力，安全问题变难了

做AI规模扩张，最好优先考虑开源权重模型

Harbor框架现在可以直接对接LangChain的Deep Agents

Harbor要成AI智能体评估的行业标准了

推理集群被认为是AI领域非常重要的突破性进展

用Gemini live搭语音代理还能拆分复杂工作

Fable 5 将向所有地区普通用户开放，不止美国

在地堡用本地AI给自己做死后发帖机器人

AI能力暴增，最近几周政策市场突然剧变

AI智能体补上了没人提的关键漏洞

中国将AI计算作为新出口向海外输送计算服务

OpenAI推出新测试基准，专门测AI处理生物数据

Harbor要成AI智能体评估的行业标准了

顶级资管桥水用自身经验微调了专属AI模型

Fable 5 将向所有地区普通用户开放，不止美国

你听说吗？AI大模型自己长出了类似人脑的功能分区

Anthropic发布了新一代Claude模型，号称目前最好的日常AI

AI做维基记忆最难的一步，居然是压缩信息

给AI智能体开放写代码能力，安全问题变难了

做AI规模扩张，最好优先考虑开源权重模型

Harbor框架现在可以直接对接LangChain的Deep Agents

Claude Sonnet 5 突然在Hacker News曝光

Hacker News热帖Claude Science引大量讨论

有人放出了Claude Sonnet 5的基准测试结果

Claude Code 价格直接涨成原来的五倍

Claude Code 正在用隐写术标记用户请求

人类语言是意识的副产品，大模型正好反过来？

Claude 桌面端终于出 Linux 测试版了

Claude Fable 5 出口管制限制正式解除了

Claude Code 被曝藏了类似间谍软件的隐藏代码

当AI代理接手长期工作后，工程师要做什么？

AI能力暴增，最近几周政策市场突然剧变

在地堡用本地AI给自己做死后发帖机器人

推理集群被认为是AI领域非常重要的突破性进展

Google发布了能用自然语言编辑视频的新模型

AI智能体补上了没人提的关键漏洞

用Gemini live搭语音代理还能拆分复杂工作

业内人士谈Anthropic Sonnet 5：实际表现优于基准测试

中国将AI计算作为新出口向海外输送计算服务

📖 深度解读

Anthropic新模型能自主跑完多步骤任务，价格更低

推理芯片量产降成本，AI产品或更便宜

谷歌新模型4秒出图，每张成本不到0.0034美分

亚马逊等AI巨头派驻工程师上门，专为企业定制AI代理

AI写App平台开始自研模型：未来更快更便宜，但也更封闭

自主操作电脑的AI助手可用统一工具链测试

📬 订阅 AI Pulse