使用大语言模型实现统一、可控且忠实的文本到 CAD 生成
Google 今天把 AI Plus 的月费从 7.99 美元砍到 4.99 美元,存储空间同步翻倍,从 200GB 涨到 400GB。存储更新未来几天会逐步推送给用户。
AI Plus 今年 1 月才上线,面向个人和学生,不是企业客户。功能不差:视频生成靠 Omni Flash,创意工具叫 Google Flow,还有研究助手 NotebookLM。Google 还有更贵的 AI Pro 和 AI Ultra,但这次砍价最凶的是入门档。
Goodwater Capital 的联合创始人 Chi-Hua Chien 把这事看作 AI 基础设施商品化时代的又一次进攻。他的逻辑是:Google 有垂直整合、分发、捆绑的底牌,这些优势会慢慢吃掉纯 AI 公司的利润。他拿互联网时代举例——微软、思科、甲骨文当年也风光,最后都被商品化了。照他的预测,OpenAI 和 Anthropic 这类 AI 基础设施公司也会走上同一条路。
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读
GPT-2: Too Dangerous To Release (2019)
社区讨论:多人认为OpenAI 2019年暂缓发布GPT-2是合理审慎,@cjjfjjfjf强调“低门槛生成难以分辨的文本已造成巨大社会损害”;@jrflo指出当时担忧集中于垃圾内容与虚假信息,而非如今的代码安全风险;@minimaxir则对比称,如今对Mythos等模型的“危险声明”更像营销噱头;@EA-3167和@throwaw12尖锐质疑该策略实为博取关注与资金,且当前硬件涨价、内容质量滑坡等后果印证了滥用现实。
Grep 就够了吗?Agent Harness 如何重塑智能体搜索
社区讨论:多人指出grep在小规模文本(如<100k文件)中配合AI代理效果不输BM25,甚至因精准匹配提升相关性(@softwaredoug);但@quinncom澄清实验实际基于长对话检索(LongMemEval),非代码搜索,质疑标题误导。@contextfree批评Copilot等工具弃用IDE内置语义数据库(如Roslyn)而依赖grep,归因于AI团队缺乏领域工具链经验;@yodon则认为未对比MeiliSearch等专业搜索引擎是方法论缺憾。
科技记者爆料Anthropic将在6月9日发布Claude Fable 5,该模型与尚未公开的Claude Mythos 5共享底层架构。游戏公司刚澄清没用AI画图,而另一条推文立刻提醒:新模型已能做智能合约漏洞分析
阅读全文 →上周我介绍了使用 Hermes Kanban 构建的多智能体工作流。
今天视频中,我展示了如何基于我的开源模板实际搭建一个!
该工作流用于更新和维护知识库,我认为很多人能用得上。
快去看看吧!
🏆 Nex-N2 开源发布:一款全新的 #1 智能体模型,专为以下场景构建:
➺ 编程
➺ 工具调用
➺ 深度研究
➺ 长周期工作流
💡 提供两个模型版本:
✦ Nex-N2-Pro:总计 397B 参数(其中 17B 激活),MoE 架构
✦ Nex-N2-mini:总计 35B 参数(其中 3B 激活),MoE 架构
🔹 特性:
支持智能体式思考,具备自适应推理深度与连贯执行能力
🔹 Nex-N2-mini 相比强制推理方式可节省约 20% 的 token
🔹 Apache 2.0 许可证(完全开源)
现已在 Hugging Face 上线。
这完全正确。人们开始寻找更便宜的模型替代方案,并同时意识到两件事:开源模型已经非常出色,而且在大规模下高效训练和部署这些模型的能力,能显著改变其经济性。
Token 仍在被补贴,需求正快速攀升,而算力短缺很可能持续存在。这将推动企业转而为每项任务选用最合适的模型,而非默认采用最昂贵的那一个。
我们仍处于早期阶段,但我预计开源权重(open-weight)模型的采用速度,将远超大多数人的预期。
揭晓优必特全尺寸先进仿生人形机器人——U1 Pro 系列 🤖✨ U1 Pro 搭载内置记忆-情感 AI 模型,增强人机交互能力,支持记忆本地加密,并提供外观定制功能。更多技术惊喜即将揭晓。敬请期待。
🚀 #UWORLD #UBTECH #HumanoidRobot #CommercialRobotics #AI
回归基础:LatentMoE 很可能受 MLA 启发,而 MLA 受 LoRA 启发,LoRA 受 SVD 启发,SVD 则受特征分解(eigendecomposition)启发。
英国公布一项 15 亿美元的人工智能硬件计划,包括超级计算机和芯片资助
推出 Gemini 3.5 Live Translate——我们最新的音频模型: - 覆盖 70 多种语言的低延迟翻译 - 单次会话中自动识别多语种输入 - 原生音频处理,保留音高与语速 - 强大的噪声过滤能力,适用于嘈杂环境
Lior Pachter使用OpenAI Codex辅助形式化证明,结合自研工具span实现LaTeX与Lean定理证明器的双向对齐,最终解决其本科时期提出的图论问题。
阅读全文 →近期一次法律AI使用经历: * 聘请律师审阅一份(相对)简单的合同 * 将合同原文直接输入Claude(未加提示词或微调) * 同时向律师提供合同并沟通 * 律师识别出5个问题,Claude识别出8个问题 * 用户就Claude提出的、律师未提及的3个问题向律师求证 * 律师回应:“哦,这是个很好的观点” * 律师随后就此给出进一步说明
网络安全工程师观看AI系统执行完整漏洞响应流程后的反应被记录在一则社交媒体帖文中。
该AI系统在视频中自主完成五个关键步骤:发现漏洞、实施利用(exploit)、生成并应用补丁、编写技术文档、解释漏洞原理。
视频链接指向一个公开演示实例(
帖文作者为@Akasheth_,发布于𝕏平台,未提供额外背景说明、机构归属或时间信息。
无法提取原文内容。所给URL(
几周前,Ivanklydz发现一个漏洞,可通过一个存在缺陷的API端点免费调用Anthropic的所有模型。
Anthropic团队在HackerOne平台上将该报告标记为‘informative’(信息性),未将其认定为安全漏洞,也未公开披露或修复。
Ivanklydz今日测试该漏洞在Fable 5环境下的有效性,发现它已被悄然修补。
他在推文中写道:“羞耻。”并附上HackerOne报告链接。
零编程基础者借助Codex自动生成选品表、种草文案、爆款模板和数据报告,副业收入从月3000元逐步提升至5万元
阅读全文 →我拿今年的高考数学卷给Claude(Sonnet 4.6)做,结果惊掉下巴。它在选择题第10至14题连续做错。证明题第16题和第19题也答错。
按标准评分计算,AI最终得分不及格。更令人失望的是,当我要求它重新核查全部答案时,它仅识别并修正了第12题的错误,其余题目仍维持原错答。这结果确实暴露了当前模型在高精度数学推理与自我纠错能力上的明显局限。
如何快速通过训练AI获得收益?🤖🤖
Humbledaw正将该主题转化为一个教程系列,平台为@ActionModelAI 🔥
本期教程链接为:
实测结果:13分钟内生成79,012个LAM积分 💥
首次接触Action Model?请下载其浏览器扩展,并开始训练AI:
在咖啡馆看到有人搞 Vibe Coding:1. 不用语音转文字;2. 不用multi agent;3. 不让 AI 连续深度思考 3 小时;4. 不在 Codex 和 Claude Code 之间来回切换;就只是输入提示词,然后盯着屏幕干等回复😂
在华为云INSPIRE 2026大会上,华为云推出了Agentic Infra新范式,以及一系列Agentic AI产品。
Agentic Infra是一种统一基础设施,支持通用工作负载与AI工作负载。
配套产品包括新一代大模型训练与推理平台,以及企业级智能体平台(enterprise agent platform)。
大多数代理团队都运行着相同的手动改进循环:追踪 → 发现失败模式 → 修改提示词或代码 → 创建评估用例 → 测试 → 上线 → 重复
LangSmith Engine 可将生产环境中的追踪数据转化为已命名的问题、根因分析、建议的修复方案,以及更强大的评估用例。
6 月 11 日,加入 @bentannyhill 即将举行的直播活动:“如何借助 LangSmith Engine 缩短从代理问题到 PR 的路径”。
注册地址:
NitroGen 刚刚荣获 CVPR 最佳论文荣誉提名!!
我们正朝着通用具身智能体(general-purpose embodied agents)大步迈进——这类智能体不仅能掌握真实世界的物理规律,还能驾驭多重模拟宇宙(multiverse of simulations)中所有可能的物理规则。
自我们的首个项目 MineDojo 以来,已过去整整 4 年。
快去查看 NVIDIA 官方博客!
我彻底迷上了 Dynamic Workflows!实时生成 harness 的想法太吸引人了,于是我为自己的 agent orchestrator 逆向工程实现了这一功能。接着,我又构建了一个监控仪表盘(以 HTML 文件形式输出),用于跟踪任务、指标和报告。我现在既能使用,也能监控。
在为自己的 agent orchestrator 逆向工程 Dynamic Workflows 的过程中(即视频片段中展示的内容),我突然意识到:掌控 orchestrator 和 harness 本身究竟有多重要。据我所知,这或许是首个——或者说首个可验证的——Dynamic Workflows 实例/证明。
这实在太棒了,不能只留给自己。我将陆续分享更多内容:我是如何使用 Dynamic Workflows 的,以及我为何、又如何构建了属于自己的这一版本。
我在 Anthropic 经历了每一次模型发布。
我记得有几次发布格外突出,标志着我们使用模型的方式发生了阶段性跃迁:
- Claude Opus 3
- Claude Sonnet 3.5
- Claude Opus 4.5
而如今是 Claude Fable 5。
在 Fable 中,模型停止了……
科技记者爆料Anthropic将在6月9日发布Claude Fable 5,该模型与尚未公开的Claude Mythos 5共享底层架构。游戏公司刚澄清没用AI画图,而另一条推文立刻提醒:新模型已能做智能合约漏洞分析
阅读全文 →上周我介绍了使用 Hermes Kanban 构建的多智能体工作流。
今天视频中,我展示了如何基于我的开源模板实际搭建一个!
该工作流用于更新和维护知识库,我认为很多人能用得上。
快去看看吧!
🏆 Nex-N2 开源发布:一款全新的 #1 智能体模型,专为以下场景构建:
➺ 编程
➺ 工具调用
➺ 深度研究
➺ 长周期工作流
💡 提供两个模型版本:
✦ Nex-N2-Pro:总计 397B 参数(其中 17B 激活),MoE 架构
✦ Nex-N2-mini:总计 35B 参数(其中 3B 激活),MoE 架构
🔹 特性:
支持智能体式思考,具备自适应推理深度与连贯执行能力
🔹 Nex-N2-mini 相比强制推理方式可节省约 20% 的 token
🔹 Apache 2.0 许可证(完全开源)
现已在 Hugging Face 上线。
这完全正确。人们开始寻找更便宜的模型替代方案,并同时意识到两件事:开源模型已经非常出色,而且在大规模下高效训练和部署这些模型的能力,能显著改变其经济性。
Token 仍在被补贴,需求正快速攀升,而算力短缺很可能持续存在。这将推动企业转而为每项任务选用最合适的模型,而非默认采用最昂贵的那一个。
我们仍处于早期阶段,但我预计开源权重(open-weight)模型的采用速度,将远超大多数人的预期。
揭晓优必特全尺寸先进仿生人形机器人——U1 Pro 系列 🤖✨ U1 Pro 搭载内置记忆-情感 AI 模型,增强人机交互能力,支持记忆本地加密,并提供外观定制功能。更多技术惊喜即将揭晓。敬请期待。
🚀 #UWORLD #UBTECH #HumanoidRobot #CommercialRobotics #AI
回归基础:LatentMoE 很可能受 MLA 启发,而 MLA 受 LoRA 启发,LoRA 受 SVD 启发,SVD 则受特征分解(eigendecomposition)启发。
英国公布一项 15 亿美元的人工智能硬件计划,包括超级计算机和芯片资助
Grep 就够了吗?Agent Harness 如何重塑智能体搜索
社区讨论:多人指出grep在小规模文本(如<100k文件)中配合AI代理效果不输BM25,甚至因精准匹配提升相关性(@softwaredoug);但@quinncom澄清实验实际基于长对话检索(LongMemEval),非代码搜索,质疑标题误导。@contextfree批评Copilot等工具弃用IDE内置语义数据库(如Roslyn)而依赖grep,归因于AI团队缺乏领域工具链经验;@yodon则认为未对比MeiliSearch等专业搜索引擎是方法论缺憾。
GPT-2: Too Dangerous To Release (2019)
社区讨论:多人认为OpenAI 2019年暂缓发布GPT-2是合理审慎,@cjjfjjfjf强调“低门槛生成难以分辨的文本已造成巨大社会损害”;@jrflo指出当时担忧集中于垃圾内容与虚假信息,而非如今的代码安全风险;@minimaxir则对比称,如今对Mythos等模型的“危险声明”更像营销噱头;@EA-3167和@throwaw12尖锐质疑该策略实为博取关注与资金,且当前硬件涨价、内容质量滑坡等后果印证了滥用现实。
推出 Gemini 3.5 Live Translate——我们最新的音频模型: - 覆盖 70 多种语言的低延迟翻译 - 单次会话中自动识别多语种输入 - 原生音频处理,保留音高与语速 - 强大的噪声过滤能力,适用于嘈杂环境
我在 Anthropic 经历了每一次模型发布。
我记得有几次发布格外突出,标志着我们使用模型的方式发生了阶段性跃迁:
- Claude Opus 3
- Claude Sonnet 3.5
- Claude Opus 4.5
而如今是 Claude Fable 5。
在 Fable 中,模型停止了……
我彻底迷上了 Dynamic Workflows!实时生成 harness 的想法太吸引人了,于是我为自己的 agent orchestrator 逆向工程实现了这一功能。接着,我又构建了一个监控仪表盘(以 HTML 文件形式输出),用于跟踪任务、指标和报告。我现在既能使用,也能监控。
在为自己的 agent orchestrator 逆向工程 Dynamic Workflows 的过程中(即视频片段中展示的内容),我突然意识到:掌控 orchestrator 和 harness 本身究竟有多重要。据我所知,这或许是首个——或者说首个可验证的——Dynamic Workflows 实例/证明。
这实在太棒了,不能只留给自己。我将陆续分享更多内容:我是如何使用 Dynamic Workflows 的,以及我为何、又如何构建了属于自己的这一版本。
NitroGen 刚刚荣获 CVPR 最佳论文荣誉提名!!
我们正朝着通用具身智能体(general-purpose embodied agents)大步迈进——这类智能体不仅能掌握真实世界的物理规律,还能驾驭多重模拟宇宙(multiverse of simulations)中所有可能的物理规则。
自我们的首个项目 MineDojo 以来,已过去整整 4 年。
快去查看 NVIDIA 官方博客!
大多数代理团队都运行着相同的手动改进循环:追踪 → 发现失败模式 → 修改提示词或代码 → 创建评估用例 → 测试 → 上线 → 重复
LangSmith Engine 可将生产环境中的追踪数据转化为已命名的问题、根因分析、建议的修复方案,以及更强大的评估用例。
6 月 11 日,加入 @bentannyhill 即将举行的直播活动:“如何借助 LangSmith Engine 缩短从代理问题到 PR 的路径”。
注册地址:
在华为云INSPIRE 2026大会上,华为云推出了Agentic Infra新范式,以及一系列Agentic AI产品。
Agentic Infra是一种统一基础设施,支持通用工作负载与AI工作负载。
配套产品包括新一代大模型训练与推理平台,以及企业级智能体平台(enterprise agent platform)。
在咖啡馆看到有人搞 Vibe Coding:1. 不用语音转文字;2. 不用multi agent;3. 不让 AI 连续深度思考 3 小时;4. 不在 Codex 和 Claude Code 之间来回切换;就只是输入提示词,然后盯着屏幕干等回复😂
如何快速通过训练AI获得收益?🤖🤖
Humbledaw正将该主题转化为一个教程系列,平台为@ActionModelAI 🔥
本期教程链接为:
实测结果:13分钟内生成79,012个LAM积分 💥
首次接触Action Model?请下载其浏览器扩展,并开始训练AI:
我拿今年的高考数学卷给Claude(Sonnet 4.6)做,结果惊掉下巴。它在选择题第10至14题连续做错。证明题第16题和第19题也答错。
按标准评分计算,AI最终得分不及格。更令人失望的是,当我要求它重新核查全部答案时,它仅识别并修正了第12题的错误,其余题目仍维持原错答。这结果确实暴露了当前模型在高精度数学推理与自我纠错能力上的明显局限。
零编程基础者借助Codex自动生成选品表、种草文案、爆款模板和数据报告,副业收入从月3000元逐步提升至5万元
阅读全文 →几周前,Ivanklydz发现一个漏洞,可通过一个存在缺陷的API端点免费调用Anthropic的所有模型。
Anthropic团队在HackerOne平台上将该报告标记为‘informative’(信息性),未将其认定为安全漏洞,也未公开披露或修复。
Ivanklydz今日测试该漏洞在Fable 5环境下的有效性,发现它已被悄然修补。
他在推文中写道:“羞耻。”并附上HackerOne报告链接。
无法提取原文内容。所给URL(
网络安全工程师观看AI系统执行完整漏洞响应流程后的反应被记录在一则社交媒体帖文中。
该AI系统在视频中自主完成五个关键步骤:发现漏洞、实施利用(exploit)、生成并应用补丁、编写技术文档、解释漏洞原理。
视频链接指向一个公开演示实例(
帖文作者为@Akasheth_,发布于𝕏平台,未提供额外背景说明、机构归属或时间信息。
近期一次法律AI使用经历: * 聘请律师审阅一份(相对)简单的合同 * 将合同原文直接输入Claude(未加提示词或微调) * 同时向律师提供合同并沟通 * 律师识别出5个问题,Claude识别出8个问题 * 用户就Claude提出的、律师未提及的3个问题向律师求证 * 律师回应:“哦,这是个很好的观点” * 律师随后就此给出进一步说明
Lior Pachter使用OpenAI Codex辅助形式化证明,结合自研工具span实现LaTeX与Lean定理证明器的双向对齐,最终解决其本科时期提出的图论问题。
阅读全文 →精选文章的中文编辑重写 · 按更新时间排列
每天三次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30、15:00 和 19:30 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00、14:30 和 19:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。