AI Pulse
AI Pulse
说人话的 AI 情报站
2026 年 7 月 2 日 08:39 更新 00 信号0 主题
试试:
今日焦点

Meta把AI数据中心变成出租生意,开始对外卖算力

Meta正在把自己的AI数据中心变成一项出租业务。这家社交媒体公司计划推出云基础设施服务,对外出售AI算力和模型访问权限。新业务线叫Meta Compute,由基础设施负责人Santosh Janardhan、超级智能实验室负责人Daniel Gross和总裁Dina Powell McCormick共同领导。

Meta的逻辑很直接:它已经在AI基础设施上承诺投入1829亿美元,俄亥俄州的数据中心项目规模相当于曼哈顿,预计今年上线。但AI业务目前几乎没有直接收入——公司没有单独披露Meta AI或Llama的收入,高管公开声明主要强调AI在内部怎么用。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 91

Claude Fable 5 开始开放推广资格申请了

关注Claude新模型进展的人,可以留意推广资格的开放信息

社区讨论:多数用户不满Anthropic的推广安排,认为 Anthropic 将 Claude Fable 5 包装成免费福利推广,推广期结束后就移出订阅套餐,后续只能按使用量 credits 付费,是把用户当待收割的奶牛,操作非常愚蠢,还会因此丢失市场份额。有人质疑,现在免费试用7天,2026年7月后就不能按原有订阅额度使用,根本没有参与的意义。还有人疑惑,不能用于代码编写和审计的话,这款模型到底有什么用处。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 46

Claude Fable 5明天就全球开放可用了

关注大模型更新的人可以留意,明天就能体验新版本了

行业动态 · Hacker News▲ 267

GLM开发团队推出了Claude Code的平替ZCode

GLM开发者做了对标Claude Code的AI编码工具ZCode,想自己找替代工具的人可以试试

行业观点 · @emollick▲ 1.7万

只用单一路线分类AI会出很多无用成果

OpenAI在研发GPT-5的时候就发现,路由分类很难做,很多问题反而更需要AI本身的能力

没错!预分类路由器会导致大量劣质工作,因为路由本身很难,而且这类方案往往会低估智能对很多问题的价值。

OpenAl 在 GPT-5 身上已经领教过这一点,现在路由器好像又火起来了。

在 X 看原帖 ↗
1.7万69319
自动化 · @RoundtableSpace▲ 1.1万

Anthropic出了教程,能把日常工作转成Claude自动流程

这套技能蓝图整理出了标准化的方法,普通办公者也能跟着把重复工作交给Claude处理

ANTHROPIC 的 Skills Blueprint 展示了如何将你的日常工作转化为 Claude 自动化流程

在 X 看原帖 ↗
1.1万1310
开发经验 · @RoundtableSpace▲ 9.6K

一个INDEX.md文件就让AI代理速度提了10倍

作者发现变慢的原因从来不是模型本身,而是给人类设计的文件夹结构不适合AI运行

只需要一个 INDEX.md 文件,就让 Hermes Agent 一夜之间快了10倍。

模型从来都不是瓶颈,文件夹结构才是。

一个能力足够的模型,如果被埋在按照人类思考方式设计、而非适合智能体搜索的结构里,完成单个任务就要打开7个错误文件,耗时2分钟。

每个文件夹放一个 INDEX.md 之后,同一个任务耗时降到了10秒。

当围绕智能体搭建的支架不再拖它后腿时,这就是智能体应有的表现。

在 X 看原帖 ↗
9.6K142
深度观点 · @omarsar0▲ 1.5万

这款叫Fable 5的AI产品,被吐槽阉割又受限

有人认为这是近年最让人摸不着头脑的AI产品发布之一,不用对它太期待。

我对这个被砍过功能、还有诸多限制的 Fable 5 实在提不起兴趣。这是有史以来最让人摸不着头脑的 AI 产品发布之一。但我们还是得继续往前走。

在 X 看原帖 ↗
1.5万2638
实战经验 · @LangChain▲ 1.3万

几分钟就能用上GLM 5.2,跟着步骤做就行

跟着公开的操作步骤走,只需要三步就能开始基于开放权重的GLM 5.2构建应用,不用花时间折腾复杂的环境配置

你只需几分钟就能开始用 GLM 5.2 开发:
1️⃣ 下载 dcode
2️⃣ 选择你的模型(GLM 5.2)
3️⃣ 输入你的 API key

之后你就能用开放权重获得前沿性能了。来自 @its_ao 的很棒的演示

在 X 看原帖 ↗
1.3万93518
新品发布 · @perplexity_ai▲ 2.0万

Claude Fable 5 重新上线,可作为编排器模型使用

Claude Fable 5 现在可在 Computer 中作为编排器模型使用

Claude Fable 5 再次作为编排器模型在 Computer 中可用。

在 X 看原帖 ↗
2.0万1229825
前沿研究 · @gdb▲ 8.4万

人类专家要做二三十小时的题,AI抢先一步了

这项测试专门检验AI能否完成计算生物学中需要大量判断的分析,目前GPT-5.6 Sol在这方面取得了明显进展

我们推出 GeneBench-Pro——用于测试模型能否处理现实计算生物学所需的、高度依赖判断的分析工作。

这类问题需要人类专家花费大约 20-40 小时才能完成。GPT-5.6 Sol 是向前迈出的一大步。

在 X 看原帖 ↗
8.4万50880110
实战经验 · @LiorOnAI▲ 3.5万

不用从头训练,把现有大模型提速2.4倍

只用到原训练数据量的8%,就能提速生成速度,同时保留原模型近99%的质量,NVIDIA已经在他们的30B模型上验证成功

你现在无需从头重新训练,就能把任意 LLM 转换为速度更快的版本。NVIDIA 刚刚在他们的 30B 模型上实现了这个技术。

秘诀如下:
1. 将模型复制为两份
2. 冻结其中一份,这份只负责读取提示词和记忆上下文
3. 训练另一份,让它一次输出整段文本,而非一次输出一个词
4. 让两份模型共同运行

被冻结的那份几乎不产生额外成本(它已经训练完成)。新的那份只需要用到原始训练数据的约 8%,就能学会这个新技巧。

结果:生成速度提升 2.4 倍,同时保留了原模型约 99% 的质量。

在 X 看原帖 ↗
3.5万24293264
深度观点 · @fchollet▲ 3.5万

这位AI专家说,这波AI不会造成大规模失业

它对劳动力市场的影响极小,主要只会增加对软件工程师的需求

当前这一波AI技术不会导致大规模失业。

事实上,它对劳动力市场的影响应该极小,主要体现为增加对软件工程师的需求。

在 X 看原帖 ↗
3.5万4250666
开发工具 · @hwchase17▲ 2.7K

开发者居然开始把GLM 5.2当日常编码主力了

分享了把GLM 5.2和deepagents代码结合使用的具体方法,不少人开始转用非海外大厂模型做日常开发

越来越多开发者开始把 glm-5.2 用作日常编码主力工具。以下是如何搭配 deepagents code 使用它的方法。

在 X 看原帖 ↗
2.7K4187
行业趋势 · @petergyang▲ 632

只追顶尖大模型的技术栈要垮了

未来企业会用组合模型控成本,日常任务交给小模型,只把复杂问题留给顶尖大模型

这是我的新帖子,里面有关于AI下一步走向的18个大胆观点:

1. 仅用前沿模型的AI技术栈正在崩塌。企业会采用模型组合来控制成本,日常任务默认使用来自中国的低成本开源模型。

2. AI超级应用时代已经到来。Codex、Claude、Cursor和其他产品正在展开竞争,通过智能代理处理你能在电脑上完成的所有操作,颠覆所有知识型工作。

3. 传统软件有沦为智能代理哑管道的风险。智能代理会成为默认用户。它们会通过API和浏览器访问你的网站和应用,全程无需人类介入查看。

4. 云端智能代理与协作是下一波浪潮。未来是智能代理驻留在云端,可从任何设备访问,并且能与你和你的团队密切协作。这会很快实现。

📌 现在即可免费阅读全部18个观点:

在 X 看原帖 ↗
63242
产品发布 · @realBigBrainAI▲ 290

Claude 3 Opus画出了带16个可动关节的机器手

生成的模型文件可以直接放到仿真环境里用,还支持不同手势动作

Claude Fable 5 造出了一只完全铰接式机器手,带有 16 个可活动关节,支持可仿真几何体与手势控制。

在 X 看原帖 ↗
2901112
研究 · @LiorOnAI▲ 2.1K

新AI模型不预测未来,专门找事情发生的原因

现在大部分世界模型都是猜接下来会发生什么,NEO换了思路,先搞懂已经发生的事为什么会发生

大多数世界模型的工作是预测接下来会发生什么。Sora 预测像素,JEPA 压缩观测结果。而 NEO 尝试搞清楚某件事为什么会发生。

举个例子:给它展示一个先向左、再向下移动的图形,它不会只重建这个运动过程,而是会把「左」和「下」作为独立可复用的基础模块学习出来,之后就能在其他场景复用它们。

NEO 不是一个大型黑箱模型,它会搜索一个简短的「程序」,这个程序由简单可复用的步骤组成,可以解释它观测到的内容。

有意思的点不在于它会学习程序,而在于它能自主发现解释所需的基础模块,不需要标签,不需要人工编码符号,只需要原始观测数据。

在 X 看原帖 ↗
2.1K4113
实战经验 · @ProfBuehlerMIT▲ 128

学术论文能用AI自动生成短视频摘要了

MIT教授已经用NotebookLM的新功能,给自己的学术论文生成了短视频摘要

我用了 @NotebookLM 全新的 Short Video Overview 功能来处理我们那篇关于图原生推理强化学习的新论文🤓;来看看吧。

在 X 看原帖 ↗
128121
深度观点 · @hwchase17▲ 2.3K

可控AI代理新模式:动态生成子代理

想要控制AI代理的生成和运行过程,可以借助程序化生成子代理的方案实现,deepagents中已有动态子代理的实现可查看。

“agentic map reduce”是个好名字。

以编程方式生成子代理,就能实现这些高级代理模式——在这种模式下,你需要一定的确定性来控制代理的创建和运行方式。

想要了解实现方式,可以查看 deepagents 中的 dynamic subagents:

在 X 看原帖 ↗
2.3K32610
行业动态 · @emollick▲ 3.7K

政府该公开说清大模型风险有多大了

呼吁官方公开他们看到的Fable风险,公开对即将到来的开放权重Mythos级模型的防御准备思路,以及担忧的风险来源

政府最好能发布一份官方声明,说明他们在Fable中发现了哪些风险,以及面对即将推出的可公开权重的Mythos级模型,他们如何看待防御准备工作。

同时也需要说明,这些担忧针对的是国家行为体,还是独立黑客等其他主体。了解这些信息非常重要。

在 X 看原帖 ↗
3.7K1663
深度观点 · @hwchase17▲ 5.8K

LangChain作者自己偏爱DeepAgents做产品

做实际产品里的AI智能体,作者本人更倾向用LangChain DeepAgents,可以参考行业实践者的选择方向

这是一篇关于了解你的harness中运行状况的价值的好帖子:「对于实际产品中的智能体,我现在倾向于使用LangChain DeepAgents」

在 X 看原帖 ↗
5.8K32514
实战经验 · @LangChain▲ 5.0K

Deep Agents 现在可以运行递归语言模型工作流了

6分钟就能学完全部操作要点,想搭建智能代理工作流可以参考这套新方法

你现在可以在 Deep Agents 中运行递归语言模型(RLM)工作流了。

@sydneyrunkle 将在6分钟内讲完你需要知道的一切。

在 X 看原帖 ↗
5.0K22211
实战经验 · @fofrAI▲ 2.3K

只用提示词就能让子代理写出完整脚本

开发者给子代理配置了hyperframes技能、Omni输出和提示词,就生成了成品内容,音乐由Lyria 3生成。

如今你能通过智能代理编写脚本实现的成果,实在太惊人了。

我给一个子代理接入了 hyperframes 技能,加上一些 Omni 输出和提示词,它就做出了这个作品。

音乐由 Lyria 3 生成。

在 X 看原帖 ↗
2.3K2716
新品发布 · @LangChain▲ 3.3K

专为AI代理设计的代码文档工具OpenWiki发布了

需要整理维护代码仓库文档的开发者,可以试试自动生成更新文档,还能针对文档和代码问答的新工具

OpenWiki 是记录代码库文档的最简单方式,专门为智能体消费信息而构建。

OpenWiki 可以生成仓库文档,随着你的代码库演进自动更新文档,还能对你的文档和代码库进行问答!

在 X 看原帖 ↗
3.3K51823
前沿研究 · @omarsar0▲ 5.9K

新方法帮AI选技能,通过率最高涨了23.1个百分点

编码AI选技能一直是瓶颈,现有方法都把选技能当成独立选择,新方法把选技能当作联合决策,在测试中提升了通过率,还降低了token成本。

这是一篇关于管理智能体技能的优秀论文。技能库规模持续增长,选择正确技能已经成为编码智能体的瓶颈。

默认方案是让智能体接触整个技能集合,或是用嵌入和重排序器检索技能。两种方式都把选择当成独立挑选处理。

SkillComposer 将组合视为一个联合决策,同时决定选哪些技能、选多少个、以什么顺序排列。

一个作用在技能标识符上的带约束自回归解码器可以单遍生成完整规划,因此连续技能之间的依赖关系会自然呈现。

在搭配 GPT-5.2-Codex 和 Gemini-3-Pro-Preview 的 SkillsBench 测试中,相比无技能方案,它的通过率分别提升了 +23.1 和 +18.2 个百分点,优于top-3检索,并且在更低提示词token成本下匹配了黄金技能上限。

论文链接:

来我们的学院学习如何构建有效的 AI 智能体:

在 X 看原帖 ↗
5.9K1273100
新品发布 · @hwchase17▲ 5.9K

现在流行用维基存大模型记忆,开源示例来了

热门的代码库维基存储大模型记忆方案,现在放出了可直接参考的开源示例

维基化记忆现在风靡一时——我们昨天已经聊过这个话题了。

今天我们发布了一个用于在代码库实现该功能的开源示例。

在 X 看原帖 ↗
5.9K44266
实战经验 · @omarsar0▲ 5.5K

80%AI输出我都用交互式HTML看,这才好用

交互式HTML更容易分辨输出质量,方便快速做决策,去年已经开始推广,现在终于有更多人用了。

我很惊讶他们花了这么久才做到。交互式 HTML 就是我大部分和智能体协作工作的方式。它占了我消费的 AI 输出的 80% 以上。

更容易找出滥竽充数的产出,也有助于快速决策。很高兴看到我们从去年开始推广的东西得到了更多采用。

在 X 看原帖 ↗
5.5K1816
行业动态 · @BrianRoemmele▲ 4.1K

Cloudflare设限,禁止AI爬虫边爬边训练

靠互联网公开内容训练的AI要受约束了,本地带搜索功能的AI反而多了发展空间

对于在互联网垃圾数据上训练的AI而言,这是一件相当重大的事。

这对于使用代理进行搜索的本地AI来说是一个利好。

“Cloudflare 设定截止日期,禁止将搜索与AI训练捆绑的AI爬虫”

在 X 看原帖 ↗
4.1K1142
AI芯片 · @PatrickToulme▲ 421

消息称Meta将推出云业务售卖自研AI芯片

行业人士透露有消息显示Meta计划推出云业务售卖AI芯片

我今天看到报道称,$META 即将推出一项云业务,销售 AI 芯片。看来我下方的预测成真了。

在 X 看原帖 ↗
4211
大模型 · @omarsar0▲ 1.1万

业内人士预测《Fable 5》热度会快速消退

称其会令玩家失望,推荐组合AI模型替代方案

我的预测:人们对 Fable 5 的热情会消退得非常快。

我重发这条是为了帮助那些玩过 Fable 5 后耗尽 tokens、或是没法用它做多少事,最终大失所望的人。

本文只是一点建议,教你如何组合多个 AI 模型来获得相同甚至更好的结果。

最棒的一点是,现在实现这个的方法很多,包括混合顶尖开放权重模型。

在 X 看原帖 ↗
1.1万34318
大模型 · @omarsar0▲ 5.4K

AI研究者称可组合OpenAI与多家大模型提升性能

业内人士提出组合不同大模型,反对单一模型直接对比

没有“如果”可言。你大可以把最新的 OpenAI 模型(哪怕是 GPT-5.5)和其他模型,比如 Opus-4.8 / GLM-5.2 组合起来使用,这样就足够了。

GPT-5.6 或是下一代前沿模型只会让效果再上一个台阶。

直接对单个模型进行比较,从现在往后看就是完全错误的思路。

在 X 看原帖 ↗
5.4K1238
行业观点 · @emollick▲ 1.5万

业内人士:AI未来讨论过分轻信企业自身愿景

企业倾向于宣扬自身持有的技术路线为AI未来方向

现在关于AI未来的讨论,对各大公司的愿景有点太过轻信了。

人们总是推销他们手里有的东西。

三大AI实验室会说更大的模型就是未来。其他所有公司只有小模型可卖,所以他们会告诉你小模型才是未来。

在 X 看原帖 ↗
1.5万71386
大模型微调 · @omarsar0▲ 7.8K

行业人士称AI微调领域将迎来革命

AI从业者观察到顶级AI机构正处于微调革命前夜

非常推荐一读。即便已经有了大量研究,微调仍是一个探索严重不足的问题。

从我在顶尖AI机构中观察到的情况来看,我们正处于一场微调革命的临界点。

智能体微调(Agentic fine-tuning)将会彻底改变AI领域的格局。

在 X 看原帖 ↗
7.8K63541
🔬 前沿研究
前沿研究 · @gdb▲ 8.4万

人类专家要做二三十小时的题,AI抢先一步了

这项测试专门检验AI能否完成计算生物学中需要大量判断的分析,目前GPT-5.6 Sol在这方面取得了明显进展

我们推出 GeneBench-Pro——用于测试模型能否处理现实计算生物学所需的、高度依赖判断的分析工作。

这类问题需要人类专家花费大约 20-40 小时才能完成。GPT-5.6 Sol 是向前迈出的一大步。

在 X 看原帖 ↗
8.4万50880110
前沿研究 · @omarsar0▲ 5.9K

新方法帮AI选技能,通过率最高涨了23.1个百分点

编码AI选技能一直是瓶颈,现有方法都把选技能当成独立选择,新方法把选技能当作联合决策,在测试中提升了通过率,还降低了token成本。

这是一篇关于管理智能体技能的优秀论文。技能库规模持续增长,选择正确技能已经成为编码智能体的瓶颈。

默认方案是让智能体接触整个技能集合,或是用嵌入和重排序器检索技能。两种方式都把选择当成独立挑选处理。

SkillComposer 将组合视为一个联合决策,同时决定选哪些技能、选多少个、以什么顺序排列。

一个作用在技能标识符上的带约束自回归解码器可以单遍生成完整规划,因此连续技能之间的依赖关系会自然呈现。

在搭配 GPT-5.2-Codex 和 Gemini-3-Pro-Preview 的 SkillsBench 测试中,相比无技能方案,它的通过率分别提升了 +23.1 和 +18.2 个百分点,优于top-3检索,并且在更低提示词token成本下匹配了黄金技能上限。

论文链接:

来我们的学院学习如何构建有效的 AI 智能体:

在 X 看原帖 ↗
5.9K1273100
🚀 新品发布
新品发布 · @perplexity_ai▲ 2.0万

Claude Fable 5 重新上线,可作为编排器模型使用

Claude Fable 5 现在可在 Computer 中作为编排器模型使用

Claude Fable 5 再次作为编排器模型在 Computer 中可用。

在 X 看原帖 ↗
2.0万1229825
新品发布 · @hwchase17▲ 5.9K

现在流行用维基存大模型记忆,开源示例来了

热门的代码库维基存储大模型记忆方案,现在放出了可直接参考的开源示例

维基化记忆现在风靡一时——我们昨天已经聊过这个话题了。

今天我们发布了一个用于在代码库实现该功能的开源示例。

在 X 看原帖 ↗
5.9K44266
新品发布 · @LangChain▲ 3.3K

专为AI代理设计的代码文档工具OpenWiki发布了

需要整理维护代码仓库文档的开发者,可以试试自动生成更新文档,还能针对文档和代码问答的新工具

OpenWiki 是记录代码库文档的最简单方式,专门为智能体消费信息而构建。

OpenWiki 可以生成仓库文档,随着你的代码库演进自动更新文档,还能对你的文档和代码库进行问答!

在 X 看原帖 ↗
3.3K51823
📰 行业动态
行业动态 · @BrianRoemmele▲ 4.1K

Cloudflare设限,禁止AI爬虫边爬边训练

靠互联网公开内容训练的AI要受约束了,本地带搜索功能的AI反而多了发展空间

对于在互联网垃圾数据上训练的AI而言,这是一件相当重大的事。

这对于使用代理进行搜索的本地AI来说是一个利好。

“Cloudflare 设定截止日期,禁止将搜索与AI训练捆绑的AI爬虫”

在 X 看原帖 ↗
4.1K1142
行业动态 · @emollick▲ 3.7K

政府该公开说清大模型风险有多大了

呼吁官方公开他们看到的Fable风险,公开对即将到来的开放权重Mythos级模型的防御准备思路,以及担忧的风险来源

政府最好能发布一份官方声明,说明他们在Fable中发现了哪些风险,以及面对即将推出的可公开权重的Mythos级模型,他们如何看待防御准备工作。

同时也需要说明,这些担忧针对的是国家行为体,还是独立黑客等其他主体。了解这些信息非常重要。

在 X 看原帖 ↗
3.7K1663
开发工具 · @hwchase17▲ 2.7K

开发者居然开始把GLM 5.2当日常编码主力了

分享了把GLM 5.2和deepagents代码结合使用的具体方法,不少人开始转用非海外大厂模型做日常开发

越来越多开发者开始把 glm-5.2 用作日常编码主力工具。以下是如何搭配 deepagents code 使用它的方法。

在 X 看原帖 ↗
2.7K4187
开发经验 · @RoundtableSpace▲ 9.6K

一个INDEX.md文件就让AI代理速度提了10倍

作者发现变慢的原因从来不是模型本身,而是给人类设计的文件夹结构不适合AI运行

只需要一个 INDEX.md 文件,就让 Hermes Agent 一夜之间快了10倍。

模型从来都不是瓶颈,文件夹结构才是。

一个能力足够的模型,如果被埋在按照人类思考方式设计、而非适合智能体搜索的结构里,完成单个任务就要打开7个错误文件,耗时2分钟。

每个文件夹放一个 INDEX.md 之后,同一个任务耗时降到了10秒。

当围绕智能体搭建的支架不再拖它后腿时,这就是智能体应有的表现。

在 X 看原帖 ↗
9.6K142
自动化 · @RoundtableSpace▲ 1.1万

Anthropic出了教程,能把日常工作转成Claude自动流程

这套技能蓝图整理出了标准化的方法,普通办公者也能跟着把重复工作交给Claude处理

ANTHROPIC 的 Skills Blueprint 展示了如何将你的日常工作转化为 Claude 自动化流程

在 X 看原帖 ↗
1.1万1310
行业观点 · @emollick▲ 1.7万

只用单一路线分类AI会出很多无用成果

OpenAI在研发GPT-5的时候就发现,路由分类很难做,很多问题反而更需要AI本身的能力

没错!预分类路由器会导致大量劣质工作,因为路由本身很难,而且这类方案往往会低估智能对很多问题的价值。

OpenAl 在 GPT-5 身上已经领教过这一点,现在路由器好像又火起来了。

在 X 看原帖 ↗
1.7万69319
行业趋势 · @petergyang▲ 632

只追顶尖大模型的技术栈要垮了

未来企业会用组合模型控成本,日常任务交给小模型,只把复杂问题留给顶尖大模型

这是我的新帖子,里面有关于AI下一步走向的18个大胆观点:

1. 仅用前沿模型的AI技术栈正在崩塌。企业会采用模型组合来控制成本,日常任务默认使用来自中国的低成本开源模型。

2. AI超级应用时代已经到来。Codex、Claude、Cursor和其他产品正在展开竞争,通过智能代理处理你能在电脑上完成的所有操作,颠覆所有知识型工作。

3. 传统软件有沦为智能代理哑管道的风险。智能代理会成为默认用户。它们会通过API和浏览器访问你的网站和应用,全程无需人类介入查看。

4. 云端智能代理与协作是下一波浪潮。未来是智能代理驻留在云端,可从任何设备访问,并且能与你和你的团队密切协作。这会很快实现。

📌 现在即可免费阅读全部18个观点:

在 X 看原帖 ↗
63242
产品发布 · @realBigBrainAI▲ 290

Claude 3 Opus画出了带16个可动关节的机器手

生成的模型文件可以直接放到仿真环境里用,还支持不同手势动作

Claude Fable 5 造出了一只完全铰接式机器手,带有 16 个可活动关节,支持可仿真几何体与手势控制。

在 X 看原帖 ↗
2901112
研究 · @LiorOnAI▲ 2.1K

新AI模型不预测未来,专门找事情发生的原因

现在大部分世界模型都是猜接下来会发生什么,NEO换了思路,先搞懂已经发生的事为什么会发生

大多数世界模型的工作是预测接下来会发生什么。Sora 预测像素,JEPA 压缩观测结果。而 NEO 尝试搞清楚某件事为什么会发生。

举个例子:给它展示一个先向左、再向下移动的图形,它不会只重建这个运动过程,而是会把「左」和「下」作为独立可复用的基础模块学习出来,之后就能在其他场景复用它们。

NEO 不是一个大型黑箱模型,它会搜索一个简短的「程序」,这个程序由简单可复用的步骤组成,可以解释它观测到的内容。

有意思的点不在于它会学习程序,而在于它能自主发现解释所需的基础模块,不需要标签,不需要人工编码符号,只需要原始观测数据。

在 X 看原帖 ↗
2.1K4113
行业动态 · Hacker News▲ 267

GLM开发团队推出了Claude Code的平替ZCode

GLM开发者做了对标Claude Code的AI编码工具ZCode,想自己找替代工具的人可以试试

行业动态 · Hacker News▲ 46

Claude Fable 5明天就全球开放可用了

关注大模型更新的人可以留意,明天就能体验新版本了

行业动态 · Hacker News▲ 91

Claude Fable 5 开始开放推广资格申请了

关注Claude新模型进展的人,可以留意推广资格的开放信息

社区讨论:多数用户不满Anthropic的推广安排,认为 Anthropic 将 Claude Fable 5 包装成免费福利推广,推广期结束后就移出订阅套餐,后续只能按使用量 credits 付费,是把用户当待收割的奶牛,操作非常愚蠢,还会因此丢失市场份额。有人质疑,现在免费试用7天,2026年7月后就不能按原有订阅额度使用,根本没有参与的意义。还有人疑惑,不能用于代码编写和审计的话,这款模型到底有什么用处。

在 HN 看讨论 ↗   原文 / 论文 ↗
💡 深度观点
深度观点 · @fchollet▲ 3.5万

这位AI专家说,这波AI不会造成大规模失业

它对劳动力市场的影响极小,主要只会增加对软件工程师的需求

当前这一波AI技术不会导致大规模失业。

事实上,它对劳动力市场的影响应该极小,主要体现为增加对软件工程师的需求。

在 X 看原帖 ↗
3.5万4250666
深度观点 · @omarsar0▲ 1.5万

这款叫Fable 5的AI产品,被吐槽阉割又受限

有人认为这是近年最让人摸不着头脑的AI产品发布之一,不用对它太期待。

我对这个被砍过功能、还有诸多限制的 Fable 5 实在提不起兴趣。这是有史以来最让人摸不着头脑的 AI 产品发布之一。但我们还是得继续往前走。

在 X 看原帖 ↗
1.5万2638
深度观点 · @hwchase17▲ 5.8K

LangChain作者自己偏爱DeepAgents做产品

做实际产品里的AI智能体,作者本人更倾向用LangChain DeepAgents,可以参考行业实践者的选择方向

这是一篇关于了解你的harness中运行状况的价值的好帖子:「对于实际产品中的智能体,我现在倾向于使用LangChain DeepAgents」

在 X 看原帖 ↗
5.8K32514
深度观点 · @hwchase17▲ 2.3K

可控AI代理新模式:动态生成子代理

想要控制AI代理的生成和运行过程,可以借助程序化生成子代理的方案实现,deepagents中已有动态子代理的实现可查看。

“agentic map reduce”是个好名字。

以编程方式生成子代理,就能实现这些高级代理模式——在这种模式下,你需要一定的确定性来控制代理的创建和运行方式。

想要了解实现方式,可以查看 deepagents 中的 dynamic subagents:

在 X 看原帖 ↗
2.3K32610
⚡ 实战经验
实战经验 · @omarsar0▲ 5.5K

80%AI输出我都用交互式HTML看,这才好用

交互式HTML更容易分辨输出质量,方便快速做决策,去年已经开始推广,现在终于有更多人用了。

我很惊讶他们花了这么久才做到。交互式 HTML 就是我大部分和智能体协作工作的方式。它占了我消费的 AI 输出的 80% 以上。

更容易找出滥竽充数的产出,也有助于快速决策。很高兴看到我们从去年开始推广的东西得到了更多采用。

在 X 看原帖 ↗
5.5K1816
实战经验 · @fofrAI▲ 2.3K

只用提示词就能让子代理写出完整脚本

开发者给子代理配置了hyperframes技能、Omni输出和提示词,就生成了成品内容,音乐由Lyria 3生成。

如今你能通过智能代理编写脚本实现的成果,实在太惊人了。

我给一个子代理接入了 hyperframes 技能,加上一些 Omni 输出和提示词,它就做出了这个作品。

音乐由 Lyria 3 生成。

在 X 看原帖 ↗
2.3K2716
实战经验 · @ProfBuehlerMIT▲ 128

学术论文能用AI自动生成短视频摘要了

MIT教授已经用NotebookLM的新功能,给自己的学术论文生成了短视频摘要

我用了 @NotebookLM 全新的 Short Video Overview 功能来处理我们那篇关于图原生推理强化学习的新论文🤓;来看看吧。

在 X 看原帖 ↗
128121
实战经验 · @LiorOnAI▲ 3.5万

不用从头训练,把现有大模型提速2.4倍

只用到原训练数据量的8%,就能提速生成速度,同时保留原模型近99%的质量,NVIDIA已经在他们的30B模型上验证成功

你现在无需从头重新训练,就能把任意 LLM 转换为速度更快的版本。NVIDIA 刚刚在他们的 30B 模型上实现了这个技术。

秘诀如下:
1. 将模型复制为两份
2. 冻结其中一份,这份只负责读取提示词和记忆上下文
3. 训练另一份,让它一次输出整段文本,而非一次输出一个词
4. 让两份模型共同运行

被冻结的那份几乎不产生额外成本(它已经训练完成)。新的那份只需要用到原始训练数据的约 8%,就能学会这个新技巧。

结果:生成速度提升 2.4 倍,同时保留了原模型约 99% 的质量。

在 X 看原帖 ↗
3.5万24293264
实战经验 · @LangChain▲ 1.3万

几分钟就能用上GLM 5.2,跟着步骤做就行

跟着公开的操作步骤走,只需要三步就能开始基于开放权重的GLM 5.2构建应用,不用花时间折腾复杂的环境配置

你只需几分钟就能开始用 GLM 5.2 开发:
1️⃣ 下载 dcode
2️⃣ 选择你的模型(GLM 5.2)
3️⃣ 输入你的 API key

之后你就能用开放权重获得前沿性能了。来自 @its_ao 的很棒的演示

在 X 看原帖 ↗
1.3万93518
实战经验 · @LangChain▲ 5.0K

Deep Agents 现在可以运行递归语言模型工作流了

6分钟就能学完全部操作要点,想搭建智能代理工作流可以参考这套新方法

你现在可以在 Deep Agents 中运行递归语言模型(RLM)工作流了。

@sydneyrunkle 将在6分钟内讲完你需要知道的一切。

在 X 看原帖 ↗
5.0K22211
📌 其他
大模型微调 · @omarsar0▲ 7.8K

行业人士称AI微调领域将迎来革命

AI从业者观察到顶级AI机构正处于微调革命前夜

非常推荐一读。即便已经有了大量研究,微调仍是一个探索严重不足的问题。

从我在顶尖AI机构中观察到的情况来看,我们正处于一场微调革命的临界点。

智能体微调(Agentic fine-tuning)将会彻底改变AI领域的格局。

在 X 看原帖 ↗
7.8K63541
行业观点 · @emollick▲ 1.5万

业内人士:AI未来讨论过分轻信企业自身愿景

企业倾向于宣扬自身持有的技术路线为AI未来方向

现在关于AI未来的讨论,对各大公司的愿景有点太过轻信了。

人们总是推销他们手里有的东西。

三大AI实验室会说更大的模型就是未来。其他所有公司只有小模型可卖,所以他们会告诉你小模型才是未来。

在 X 看原帖 ↗
1.5万71386
大模型 · @omarsar0▲ 5.4K

AI研究者称可组合OpenAI与多家大模型提升性能

业内人士提出组合不同大模型,反对单一模型直接对比

没有“如果”可言。你大可以把最新的 OpenAI 模型(哪怕是 GPT-5.5)和其他模型,比如 Opus-4.8 / GLM-5.2 组合起来使用,这样就足够了。

GPT-5.6 或是下一代前沿模型只会让效果再上一个台阶。

直接对单个模型进行比较,从现在往后看就是完全错误的思路。

在 X 看原帖 ↗
5.4K1238
大模型 · @omarsar0▲ 1.1万

业内人士预测《Fable 5》热度会快速消退

称其会令玩家失望,推荐组合AI模型替代方案

我的预测:人们对 Fable 5 的热情会消退得非常快。

我重发这条是为了帮助那些玩过 Fable 5 后耗尽 tokens、或是没法用它做多少事,最终大失所望的人。

本文只是一点建议,教你如何组合多个 AI 模型来获得相同甚至更好的结果。

最棒的一点是,现在实现这个的方法很多,包括混合顶尖开放权重模型。

在 X 看原帖 ↗
1.1万34318
AI芯片 · @PatrickToulme▲ 421

消息称Meta将推出云业务售卖自研AI芯片

行业人士透露有消息显示Meta计划推出云业务售卖AI芯片

我今天看到报道称,$META 即将推出一项云业务,销售 AI 芯片。看来我下方的预测成真了。

在 X 看原帖 ↗
4211

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

▲ Top
把任何一条丢给知识库,它基于全站内容给你带引用的回答。
✦ 去问知识库

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部