AI Pulse · 2026 年 6 月 29 日

今日焦点

跨产品限制Claude：环境隔离与分层防御实战

我们如何在不同产品中安全包含Claude

十二个月前，我们还会断然拒绝让Claude拥有足以拿下内部Anthropic服务的访问权限。如今，这种级别的访问已是家常便饭，而Anthropic的开发者也因此效率更高。这些部署的风险包含两个部分：故障发生的概率有多大，以及故障可能造成多大损害。安全防护和模型训练的进展稳步降低了前者；后者——理论上的破坏半径——则随着能力和访问权限的扩展而增长。然而，当智能体能够完成曾经需要一个人甚至一个团队才能完成的工作时，不部署的成本变得足够大，以至于只要产品能够做到安全，风险回报计算就强烈倾向于采用。工程问题变成了如何限制破坏半径。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 173

OpenAI Codex 无法排除敏感文件，问题还没修

用OpenAI Codex写代码的时候，还没法让它不碰敏感文件，这个问题从出现到现在一直没解决。

社区讨论：多数从业者认同不能依赖OpenAI官方的屏蔽列表解决问题，大语言模型行为不可预测，做不到完全排除敏感文件。大家公认正确解法是靠系统权限隔离，比如修改文件权限、将编码代理放在独立干净容器或云虚拟机中运行，让代理本身没有读取敏感文件的权限。有人提出该功能本就是画蛇添足，只会给用户虚假的安全感，还有用户指出这个问题已经拖了一年仍未修复。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 35

从零手写GPT-2规模大模型，全用纯C/CUDA

想进AI领域工作，不如从底层手写一个大模型，搞懂参数、数据和GPU的关系

大家好，在 anthropic 的 Fable 被禁之后，我开始开发 nanoeuler。我的雄心和梦想是进入 AI 领域，在 anthropic 工作。促使我创建 nanoeuler 的两个有趣原因是：(1) 调用大语言模型接口不代表理解它们的组成结构，(2) 在非常底层的层面开发大语言模型，可以理解参数、数据和模型增长之间的关联，以及 GPU 的工作原理，还有如何优化部分网络层。

于是我开始开发

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 53

大语言模型能通过镜子测试吗？这问题吵翻了

讨论核心直指大语言模型是否拥有自我意识，关心AI发展方向，能在这里看到不同角度的思考

社区讨论：不少人认为当前对大语言模型做镜子测试的思路本身不合理，大语言模型本质是下一个token预测系统，现有对话交互模式经过指令调优，已经带有“做有用助手”的强偏差，剥离额外微调才能看清模型真实能力。有人提出更适合大语言模型的自我认知测试是让它说出关于自身训练数据的事实，还推测模型后训练阶段被调整过，不会准确回答这类问题。也有人质疑，不该因为大模型能聊天，就忘了它本身的本质，非要用镜子测试考察它。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 366

国内开源大模型GLM 5.2跑分超过了Claude

这次测试结果发布在Hacker News，引发了三百多个点赞和一百多条讨论，有人关注测试结果的真实性。

社区讨论：有资深开发者实测称GLM-5.2适配日常编程场景，成本远低于GPT。也有用户多次试用后认为GLM体验很差，该跑分结果读起来像推广软文。多名用户指出这次跑分对比不严谨：没有明确标注对标Claude的具体型号，把GLM单prompt和Claude Code多智能体系统对比，还混淆了Claude品牌和对应大模型的概念。

有用户预测美国接下来会出台出口管制，要求OpenRouter、HuggingFace下架部分中国开源模型。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 107

美国限制出口后，奥地利抢着邀请Anthropic落户欧盟

美国AI企业想出海的，有欧洲国家愿意开出优惠条件接走。能绕开本土出口限制，也能避开其他地区竞争。

社区讨论：多数人认可欧盟要维持AI研发前沿，必须自主布局AI研发与算力基础设施。有人指出欧盟法规虽然繁琐但监管规则清晰可预期，适合大额投资的前沿AI机构落地。也有人质疑落地可行性，认为美国会出台惩罚性出口限制，Anthropic创始人是美国爱国者不会愿意离开美国，还有人称就算拿到硬件也绕不开美国的出口管制。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 142

谷歌限制了Meta使用自家Gemini大模型

两大科技巨头之间的AI合作已经生变，头部玩家的关系变化影响后续AI产品走向

社区讨论：不少人认为原标题存在误导，本次谷歌限制Meta使用Gemini是算力容量约束，并非限制Meta使用模型的功能或用途。有人质疑Meta本身自研大模型，却大量使用谷歌Gemini而非竞品，猜测是战略竞争或成本原因。还有人提出，未来获取顶级前沿大模型，会逐步对机构增加算力、合规等限制，个人用户的服务优先级会被降低。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 318

有人用Claude Code给自己的MRI看了第二意见

面对医疗检查结果拿不准，除了找医生读片，现在有人开始用AI工具做二次核对，看看会不会有遗漏

社区讨论：多数用户认为大模型目前不足以给出可靠的医学影像第二意见，真正的放射科专家普遍指出AI输出存在不足、误导性问题，也有用户明确表示不会用Claude这类模型分析图像。有用户分享个人经历称ChatGPT曾通过文本分析准确指出自己MRI报告的错误，另有从业者建议医生可以将合规大模型作为辅助工具，查看是否遗漏细节。

在 HN 看讨论 ↗ 原文 / 论文 ↗

动态 · @mevil_bhojani▲ 28.1万

一个终端就能看530多款AI工具的实时热度

还整理了361个模型的定价、最新论文、融资和岗位信息，排名没有赞助

当下AI圈真正热门的东西是什么？不是空喊概念，而是实时动态。🔥

收录了530+工具的热度榜💸

361款模型的定价信息📄

热门论文💰

融资信息+岗位机会

全部整合在一个终端里。排行榜从不接赞助。

跨产品限制Claude：环境隔离与分层防御实战

我们如何在不同产品中安全包含Claude

🔥 信号雷达

OpenAI Codex 无法排除敏感文件，问题还没修

从零手写GPT-2规模大模型，全用纯C/CUDA

大语言模型能通过镜子测试吗？这问题吵翻了

国内开源大模型GLM 5.2跑分超过了Claude

美国限制出口后，奥地利抢着邀请Anthropic落户欧盟

谷歌限制了Meta使用自家Gemini大模型

有人用Claude Code给自己的MRI看了第二意见

一个终端就能看530多款AI工具的实时热度

没人知道OpenAI把GPT-6的标签留来干嘛

指望开源救模型？地缘这事开源也躲不开

人形机器人博主完成17天中国行程探访18家厂商

Google DeepMind播客探讨智能体经济兴起与发展

黑盒大模型也能被蒸馏出知识了

不用装Python，单文件Bash就能调用LLM

AI服务器需要的内存是普通服务器的8-10倍

有人把一整套开发团队做成Claude Code工具集

只要能命令行或API调用的活，都丢给GLM 5.2智能体做

土耳其发布了本国第一款工业人形机器人AKINCI-5

开源语音工具WhisperX能把转写速度提70倍

不同AI工具终于能共享同一个记忆了

HeyGen用自家HyperFrames做了世博会开场视频

不用GPU！CPU本地就能跑千亿级AI模型

之前被Meta关停的Papers with Code复活了

做一条AI动画广告只要12美分，不到3分钟

虚幻引擎5.8 MCP完成AI生成Niagara模拟测试

开发者将自适应超级趋势指标转换为Python代码完成扫描

从零搭建Python算法交易系统完整路线图

开源AI迎来第二次DeepSeek时刻，本次市场未出现崩盘

周一网单个AI代理尝试调用200余款工具引发问题

Claude加五个循环组件可搭建自动化无人编码系统

GitHub测试Copilot智能框架性能 表现优于原生框架

博主分享未来科技团队五种新型角色 archetype 划分

开发者分享基于多款大模型的全新AI开发工作流

研究者分享对大语言模型催生AGI路径的个人观点

HeyGen用自家HyperFrames做了世博会开场视频

没人知道OpenAI把GPT-6的标签留来干嘛

AI服务器需要的内存是普通服务器的8-10倍

有人把一整套开发团队做成Claude Code工具集

一个终端就能看530多款AI工具的实时热度

只要能命令行或API调用的活，都丢给GLM 5.2智能体做

土耳其发布了本国第一款工业人形机器人AKINCI-5

开源语音工具WhisperX能把转写速度提70倍

有人用Claude Code给自己的MRI看了第二意见

谷歌限制了Meta使用自家Gemini大模型

美国限制出口后，奥地利抢着邀请Anthropic落户欧盟

国内开源大模型GLM 5.2跑分超过了Claude

大语言模型能通过镜子测试吗？这问题吵翻了

不用装Python，单文件Bash就能调用LLM

黑盒大模型也能被蒸馏出知识了

从零手写GPT-2规模大模型，全用纯C/CUDA

OpenAI Codex 无法排除敏感文件，问题还没修

之前被Meta关停的Papers with Code复活了

不同AI工具终于能共享同一个记忆了

不用GPU！CPU本地就能跑千亿级AI模型

指望开源救模型？地缘这事开源也躲不开

做一条AI动画广告只要12美分，不到3分钟

Google DeepMind播客探讨智能体经济兴起与发展

研究者分享对大语言模型催生AGI路径的个人观点

开发者分享基于多款大模型的全新AI开发工作流

博主分享未来科技团队五种新型角色 archetype 划分

GitHub测试Copilot智能框架性能 表现优于原生框架

Claude加五个循环组件可搭建自动化无人编码系统

周一网单个AI代理尝试调用200余款工具引发问题

开源AI迎来第二次DeepSeek时刻，本次市场未出现崩盘

从零搭建Python算法交易系统完整路线图

开发者将自适应超级趋势指标转换为Python代码完成扫描

人形机器人博主完成17天中国行程探访18家厂商

虚幻引擎5.8 MCP完成AI生成Niagara模拟测试

📖 深度解读

跨产品限制Claude：环境隔离与分层防御实战

惠普用OpenAI AI把员工几周工作缩至几天，未来客服响应更快

AI公司狂抢内存芯片，你的手机电脑游戏机已涨价

📬 订阅 AI Pulse

GitHub测试Copilot智能框架性能表现优于原生框架

GitHub测试Copilot智能框架性能表现优于原生框架