AI Pulse
📚 0 篇文章
📡 0 条信号
🏷️ 0 个主题
📰 今日焦点

跨产品如何控制Claude:环境隔离与爆炸半径管理

跨产品如何控制Claude

十二个月前,我们还会毫不犹豫地拒绝让Claude拥有足以攻破Anthropic内部服务的权限。而如今,这种级别的访问权限已成为常态,Anthropic的开发者也因此更高效。这些部署的风险包含两个组成部分:故障发生的可能性有多大,以及一旦发生可能造成多大损害。安全防护和模型训练的进展稳步降低了前者;后者——即理论上的爆炸半径——则随着能力和访问权限的扩展而不断增大。然而,当代理能够完成曾经需要一个人甚至一个团队才能完成的工作时,不部署的代价也足够大,以至于只要产品能够做到安全,风险回报计算就会大幅倾向于采用。工程问题就变成了如何限制爆炸半径。

如果能够对自主代理的相对损害设定边界——例如通过控制其运行环境——那么高实用性的能力就可以推动部署。Claude Mythos Preview就是一个例子:该模型在2026年4月被认为爆炸半径过高而未能发布。然而,我们预计随着防御者加固关键系统、防护机制日趋成熟,具有类似能力水平的模型将会更广泛地发布——尽管风险始终存在。模型能力是代理部署总风险中的一个重要因素。

阅读全文 →
✨ AI 智能助理 基于全站知识库综合问答
💡 试试问我: ·

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读

Apache Burr:让AI代理不再乱跑

AI agentApache

Apache Burr:构建可靠的 AI 智能体与应用程序

社区讨论:多人质疑Burr的Apache项目身份与设计风格,@flakiness对比其“非典型”首页与Apache HTTP Server官网,@redlewel批评其“vibeslopped”落地页和“700+ Discord成员”缺乏技术可信度。@tcdent指出Python装饰器被误用于流程控制而非本意的函数过滤(如缓存、序列化),批评FastAPI式用法泛滥。@hbarka和@hmokiguess分别提出与DSPy、Strands Agents的横向对比需求,反映开发者正权衡不同框架在状态管理、平台锁定与易用性间的取舍。

在 HN 看讨论 ↗   原文 / 论文 ↗

AI代理终于能安全跑Lua脚本了

AI代理沙箱

Lua.ex:基于 BEAM 的沙箱化 Lua 5.3,专为 AI Agent 构建 · Lua.ex

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Code配额直接挂菜单栏了

macOSClaude Code

Show HN:适用于 macOS 菜单栏的 Claude Code 配额计量器

社区讨论:多人批评Claude Code未在底部状态栏显示配额百分比,如@giancarlostoro要求“Weekly Quota Left: 99%”提示;另有用户指出会话未自动压缩导致配额耗尽过快。@artdigital质疑通过curl+bash脚本安装的安全风险,强调应提供直接下载或Homebrew安装。工具选择存在分歧:@rippeltippel和@fosron力推CodexBar(支持多模型),@tskulbru用Linux原生ClaudeBar,@ceritium则自建独立配额监控页。

在 HN 看讨论 ↗   原文 / 论文 ↗

安全研究员集体吐槽Anthropic新模型的护栏

AI安全大模型

Anthropic发布Fable模型,网络安全研究员公开批评其内置限制——这些限制影响他们测试模型真实行为的能力。

阅读全文 →

一分钱转账就能黑掉银行AI代理

AI安全金融AI

一笔仅 0.01 欧元的银行转账,就可能危及一个银行 AI 代理。

社区讨论:多数人指出LLM将交易描述误判为指令是根本性缺陷,@EnglishRobin96称“只要存在此问题,LLM就永无安全可言”;@zkmon质疑为何需用LLM解析确定性交易数据;@nerder92则认为攻击需用户主动点击恶意链接、接收陌生转账并主动查询,实际门槛较高;@reddalo类比SQL注入回归,@bilekas直斥将AI置于未经请求的财务决策中属严重失职;@nticompass反讽“唯一解是移除AI代理”。

在 HN 看讨论 ↗   原文 / 论文 ↗

每次打开Claude桌面版,都白占1.8GB内存

ClaudeHyper-V

Claude Desktop 每次启动都会生成一个 1.8 GB 的 Hyper-V 虚拟机,即使仅用于聊天场景。

社区讨论:多人批评Claude桌面版强制启动10GB VM并常驻1.8GB内存,且无禁用选项(@tom1337、@nathanyz);@cortesoft反问“无法停止难道不是好事”,遭@HypnoticOcelot指出逻辑矛盾;@dbmikus则为VM设计辩护,称微虚拟化是沙箱化AI代理的未来方向;@tkcranny直言应用启动慢、交互卡顿,“与其宣传严重不符”。

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude企业版强制存30天数据

AI合规企业服务

链接无效:该 URL 无法访问。

社区讨论:多人指出企业版强制30天数据留存实际意味着Anthropic可无限期保留数据,因条款写明“几乎所有情况下30天后删除”,留有自由裁量权(@pseudosavant);有人认为风险本质在于“使用即上传”,只要接受数据外传就已构成隐患(@keithnz);另有开发者质疑这可能直接违反NDA(@thekevan),并已紧急将所有代理设为data retention mode 'none'以规避(@pbgcp2026)。

在 HN 看讨论 ↗   原文 / 论文 ↗

文本生成快了4倍,用的是扩散模型

AI文本生成

DiffusionGemma: 4x Faster Text Generation

社区讨论:多人指出扩散模型在边缘设备(如手机、本地GPU)上优势显著,因无需逐token自回归解码,适合低延迟场景(@samuelknight);但也有用户质疑其实际质量,称本地扩散模型“明显不如廉价API模型”,不愿为速度牺牲质量(@SkitterKherpi)。@LarsDu88追问扩散文本模型相比自回归模型的固有缺陷,而@minimaxir则基于硬件对比图质疑“高成本”传言,认为DiffusionGemma在同等H100下应不更贵。

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Fable 5发布,附带系统卡PDF

ClaudeAnthropic

System Card [pdf]:https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c3...

社区讨论:多数用户确认Fable 5在代码任务(如MicroPy库开发)和Pelican基准测试中显著强于Opus 4.8。@simonw提供多组实测链接佐证性能提升,@bkjlblh和@mohsen1则指出模型主动拒绝LLM相关提问(如解释论文、设计训练管道),因Anthropic新增“前沿LLM开发干预”机制。@frevib质疑命名营销策略未带来实质进步,@pietz和@caleblloyd聚焦商业影响:6月23日后需用量信用,企业API成本或达2万美元/月,接近资深工程师年薪。

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Design 其实是个能直接跑在浏览器里的 AI 助手操作系统

AILAUNCH
1.4万788110

Claude Design 有一个完整的 Agent 运行环境,如果把它跟 Claude Code 比较的话,只是它基于浏览器和虚拟机来构建的。它有45个工具,有24个内置skills。运行方式也是基于 Agentic Loop。

所以它就是一个完整的 Agent Harness。

在 X 看原帖 ↗

企业微信突然能被 AI 当后台系统直接操作了

AITOOL
5.0K38646

企业微信自动化,一个挺实用的开源库:wecom-cli ​它不是做 Chatbot,是把企微的日常办公动作封装成 AI Agent 的 Skills(工具)。 目前支持: 1.​通讯录查询 & 发消息 2.​日程查询 & 创建会议 3.​待办管理 4.​文档和智能表格的读写 5.​这就把企微从一个聊天软件变成了 AI 可以直接操作的后台系统。 ​有相关开发需求的可以看看:

在 X 看原帖 ↗

Linux 开发者正用 AI 给老款 AMD 显卡续命

AIEXPERIENCE
7.7K2416321

Linux 开发者正在使用 AI 辅助编程(vibe coding)来维持老旧 AMD GPU 的生命力

在 X 看原帖 ↗

工薪阶层孩子玩 SOTA 模型,可能像买不起江诗丹顿一样自然

AIOPINION
2.6万116515

服了你们了,anthropic,Claude一有什么事,就AT我做达里奥新视频,我也很想做,没时间啊,兄弟,我还要分精力搞LLM,后面还有各种服务器benchmark,尽可能保证闲暇之余给大家更新!做AI视频真不是我主业,纯瘾大。新模型还没时间用,但我估计工薪阶层家的孩子会越来越玩不起SOTA模型,这个就像玩儿表一样的,你以为积家是顶了,高端的江诗丹顿门你都摸不到,达里奥正在试图用模型给人类分级,我们的AI社会地位正在拉开差距。

他会为此付出代价。

在 X 看原帖 ↗

说‘换便宜模型省钱’,其实是在用更差的工具做同一件事

AIOPINION
6.1K612813

“切换到更便宜的模型以节省成本”本身就是一个问题,因为更便宜的模型性能更差(也许对某个特定用途来说已足够好,但依然更差)。

更常见的更好做法是采用模型层级结构:由更智能的模型担任协调者与审核者,来调度和监督更便宜的模型。

在 X 看原帖 ↗

600 多篇论文正把 LLM 塞进网络安全的每个检查点

AIRESEARCH
2.8K268882

超赞的 LLM4Cybersecurity:600 多篇关于 AI 驱动网络安全的研究论文 🛡️💀 🤖
当大语言模型(LLM)遇上网络安全。

该仓库整理了 600 多篇研究论文,涵盖 AI 驱动的漏洞检测、威胁情报、网络防御、进攻性安全、模糊测试(fuzzing)以及自主安全代理等方向。

🔗 #LLM #CyberSecurity #AIResearch #ThreatIntel #GenAI #OpenSource

在 X 看原帖 ↗

AI在帮区块链找漏洞——不是未来,是现在

AI安全区块链
3.7K161376

解释 Monad Bugfinder:我们正在使用的内部 AI 辅助漏洞发现系统,用于帮助保障 Monad 区块链的安全。 附有直播链接。 博客文章:

在 X 看原帖 ↗

AI开始反向审问你:42个词撬动需求确认

AI协作开源项目
3.1K105352

有位老哥把自己几十年的工程实战经验一股脑塞进了这个开源项目,直接冲上GitHub热榜第一,狂揽12.4万Star。作者是前Vercel工程师,参与过Next.js早期开发,整理了16个和Claude协作的实战技巧,一条命令装完。最绝的是Grim这个skill——让AI反过来审问你,顺着决策树一条条确认需求,搞清楚你要什么再动手。

就42个词,被人称为“token回报率最高的提示词”。还有专治代码跑不起来的skill,强制AI先写必败测试,再写最少代码让它过,经典红绿循环,AI想偷懒都没机会。地址:

在 X 看原帖 ↗

终端里跑的AI编程搭档,免费配百万上下文模型

AI编程开源工具
4034262

🚀 MiMo Code V0.1 现已上线并开源!
它不只是终端里的 AI 编程助手——而是你将合作过的最聪明的编程搭档。

它搭载 MiMo V2.5,这是一款多模态模型,限时免费提供,支持百万 token 上下文窗口——随时待命。

在 X 看原帖 ↗

一个非营利组织刚成立,专攻超级智能对齐

AI对齐超级智能
8.4万106683277

我们正在成立一家新的非营利性对齐研究组织——⊢ Sequent Research,汇聚此前在英国人工智能安全研究所(UK AISI)对齐团队、Timaeus 以及其他机构从事相关工作的研究人员,共同开展超级智能对齐研究。我们正在招聘! 🧵

在 X 看原帖 ↗

3%的注意力头一关掉,AI逻辑推理就崩了

Mechanistic InterpretabilityLLM推理
2.7万82379264

Llama-3.1-8B等模型中约3%的Attention Head被关闭后,ProntoQA正解率跌至44.6%,接近随机猜测水平。

阅读全文 →

Claude最新模型只对付费用户开放

AIClaude
1.6万2130135

Claude Fable 5 现已在 Computer 中作为编排模型上线。
这是 Anthropic 面向长周期、复杂任务的最先进模型。

该模型仅对 Computer 的 Pro 和 Max 订阅用户开放。

在 X 看原帖 ↗

Codex+GPT-5.5能变成持续干活的开发系统

TUTORIALCodex
2.2万104483587

Open AI 曾官方点名的Codex 视频 值得收藏,不到 2 小时,把 Codex + GPT-5.5 这套组合讲得很实: - 技能怎么配。- 插件怎么用。- 自动化工作流怎么搭。

- 多任务怎么并行跑。- 以及最关键的,怎么把 Codex 从一个聊天窗口,变成一个可以持续帮你干活的开发系统。真正高效的方式,是你先把上下文、技能、流程、权限、任务边界搭好,然后让 AI 在一个更稳定的工作环境里执行。

在 X 看原帖 ↗

Fable 5 擅长 Three.js 开发,生成一款受《佛莱迪的五夜后宫》启发的游戏

AIWeb开发游戏
8516

Fable 5 擅长 Three.js 开发。开发者使用最大推理强度,模型持续运行直至自认为代码已达到完美状态。

该游戏灵感来自《佛莱迪的五夜后宫》(FNAF)。

游戏链接为:

据开发者估算,该项目开发成本约为 49.80 美元。

在 X 看原帖 ↗

Base App上线10天已收近1000份联盟计划申请

商业Web3增长
1.2K1403

我本周正在审核近1,000份Base App联盟计划(affiliate program)申请,此时距该计划启动仅过去10天😅。

申请者类型多样:包括小型创作者、大型KOL(关键意见领袖)、实用工具类网站、广告网络以及加密货币交易平台。

真正重要的不是规模或渠道类型,而是申请者的受众质量,以及其与@baseapp的实际契合度。

在 X 看原帖 ↗

创始人正为可免费获取的软件付费

创业开源商业
3.1K35958

大多数创始人正在为本可免费获取的软件付费。许多此类服务无需风险投资支持即可使用: → @Cloudflare 提供托管服务,最高额度达25万美元; → @msft4startups 提供云服务与AI资源,信用额度为5000至15万美元; → @AWSstartups 提供云服务信用额度,为5000至10万美元; → @Atlassian 提供项目管理与运维工具,免费使用期为12个月。 文中附带8个链接,其中1个为额外补充链接。

在 X 看原帖 ↗

用户用4个AI代理自动管理加密投资组合

AI加密货币自动化
1.3K832

我有4个AI代理在我睡觉时为我的投资组合工作:一个读取资金费率;一个标记正在抛售代币的钱包;一个为我草拟社交平台帖子;一个在我犯错时提醒我。

这四个代理每月花费的成本,比多数人买咖啡的月支出还低。

人们仍以为竞争优势藏在某个秘密的Discord群组里。

链接:

在 X 看原帖 ↗

LangSmith推出免费课程教用户监控AI代理成本与性能

AI工程开源
4.3K54514

LangSmith可帮助用户追踪AI应用运行成本,通过链路分析(trace analysis)发现性能趋势,并监控输出质量与响应延迟。

LangChain团队为此开发了一门完整课程,逐步讲解LangSmith在全栈场景中的使用方法。

用户可免费报名LangChain Academy的这门课程,学习如何在生产环境中监控并优化AI代理(agents)。

在 X 看原帖 ↗

Fable 5单条prompt生成成都3D游览地图

AI工具地理信息
1.1万84532

Fable 5真的很厉害!我只用一条prompt做了成都市中心3D游览地图,人民公园,安顺廊桥,太古里,宽窄巷子……本成都人看着都想家了。

prompt内容为:为成都中心城区创建一个3D可自由探索的地图plan.md文件。设计plan.md时,要加入在进入下一步前必须先检查的循环机制。

该成果由@StarchildOnX AI Agent制作,链接为

在 X 看原帖 ↗

Claude Fable 5 可直连本地 Ansys 2026 R1 完成威尔金森功分器仿真

AI仿真EDA
1.5万28186138

Claude Fable 5 AI仿真工程能力有多强?我给Claude发了一段用Ansys Electronics做一个3 GHz的威尔金森一分二功分器仿真需求,剩下的活全是它干的。

它通过我开发的AEDT MCP插件,直连我本机安装的Ansys Electronics Desktop 2026 R1软件。

连接建立后,Claude Fable 5自动执行全部仿真准备步骤:新建工程、定义介质板材料、绘制微带线结构、镜像生成对称支路、添加隔离电阻、设置端口、施加辐射边界条件,并启动求解器运行仿真。

在 X 看原帖 ↗

Claude Code爬虫手册:5个开源工具让AI直接操作网页

AI开源工程
6.8K97856

Claude Code终极爬虫手册:5大开源Skill让AI真正会上网干活。

想让Claude别再只是聊天工具,而是直接上手抓数据、操作网页、批量处理内容?下面这套组合就是最实用的方案。

方案整理成这份手册,可直接复制给Claude Code、Cursor、Codex使用。

顺序从日常最常用排到重度操作,零门槛。

1. 日常80%需求:社媒与公开内容一键抓取
工具:Agent-reach
地址:

在 X 看原帖 ↗

Anthropic发布Claude Fable 5引发安全政策不一致争议

AI安全商业
2.3万4434163

Natolambert在𝕏平台发文质疑Anthropic在发布Claude Fable 5时采取的不均衡安全政策。

他认为,这种不一致的安全策略削弱了更广泛AI社区的凝聚力。

他还指出,该做法加速了AI在短期内演进过程中的不确定性与风险。

Natolambert在文末说明,自己过去几天身体不适,因此这篇博文是在快速写作状态下完成,若有疏漏请予体谅。

在 X 看原帖 ↗

新方法QGF优化扩散策略训练,避开BPTT不稳定性

AI强化学习扩散模型
3.3万61644590

扩散模型(或流模型)能生成优异的策略,但用强化学习(RL)训练它们 notoriously 困难:反向传播通过时间(BPTT)不稳定,而对扩散过程直接应用RL会严重拉长有效决策步长(horizon)。

在新论文中,研究者展示了如何通过一种“奇特技巧”——“近似”雅可比矩阵(Jacobian)——来优化流匹配(flow matching)策略。相关链接:

该方法名为QGF(Q-function Gradient Flow),在实验中优于使用真实雅可比矩阵或BPTT的方案。QGF是纯测试时(test-time)方法:策略本身通过行为克隆(BC)训练,Q函数通过时序差分(TD)训练;在测试阶段,仅用恒等矩阵(identity Jacobian)作为雅可比矩阵的近似,对Q函数关于动作进行优化。链接:

更多细节见论文及项目网站: 和 @jtspringenberg 合作完成。

在 X 看原帖 ↗

Kyutai实验室用强化学习优化全双工语音模型交互性

AI语音模型强化学习
1.3万29179117

Kyutai实验室发布新论文《全双工语音模型中的多维度交互对齐》。团队使用强化学习(RL)对语音模型Moshi和PersonaPlex进行后训练,使其更接近人类对话行为:准确判断何时回应、何时静默等待、何时在倾听时以‘yeah’或‘okay’等方式进行副语言反馈(backchanneling)。

全双工语音模型(如Moshi和PersonaPlex)理论上比传统轮替式(turn-based)语音模型更自然,但实践中仍存在明显问题:该说话时不说话、不该说话时插话、缺乏副语言反馈。

问题根源之一是监督学习中使用的词元级(token-level)损失函数。例如,模型选择静默而非发出‘yeah’这类反馈,在交叉熵损失中代价极低,但人类听感上却显著不自然。而强化学习后训练可直接建模序列级目标,例如“每隔一段时间进行一次副语言反馈”。

该方法已应用于Moshi和NVIDIA开发的PersonaPlex模型,所有评估指标均获得提升。评估采用Full-Duplex-Bench v1(向模型输入预录制音频)和v2(模型参与实时多轮对话)两个版本基准测试。

在 X 看原帖 ↗

PoeticHQ发布新AI系统:多小时复杂任务准确率超99%

AI商业工程
8.2K2310433

PoeticHQ推出一款新型AI系统,可执行持续数小时的复杂任务,准确率达99%以上,所需token数量比当前AI代理减少10倍。

该公司已从Kleiner Perkins、Founders Fund、First Harmonic和Genius Ventures获得5000万美元融资,估值5亿美元。

融资将用于构建能在《财富》500强企业内部执行复杂工作的AI系统。

彭博社报道了PoeticHQ的相关消息。

PoeticHQ正在招募人才,目标是让AI在世界顶级企业中完成真实工作任务。

在 X 看原帖 ↗

开发者因AI API账单过高转向本地部署AI编程

AI工程开源
18.6万67482591

很多开发者最痛的不是不会用 AI。是 AI 越用越爽,账单越看越想死。有个开发者 10 天就干出 170 美元 Claude Code 账单,结果评论区有人直接给了一个狠方案:别继续烧 API 了,买台 Mac mini,把 AI 编程小队搬回本地。

基础款 Mac mini M4,599 美元。装 Ollama,拉本地模型,跑几条命令,然后把

在 X 看原帖 ↗

METR评估发现超半数SWEBench结果不可合并

AI评估工程
17.8万76771381

终于发布了!!!
@METR_Evals 发现,SWEBench 中超过一半的结果是无法合并的“垃圾代码”(slop)。

FrontierCode 代表了维护者验证过的、超 1000 小时的软件工程工作,绝大多数前沿模型目前尚无法解决其中的问题,更不用说以高质量方式解决了。

Cog had IOI

在 X 看原帖 ↗

Minerva获2000万美元A轮融资,推出AI客户意图理解平台

AI商业营销
110.2万3551.8K1.3K

Minerva宣布完成2000万美元A轮融资,联合OpenAI推出可实现超个性化营销的AI客户洞察平台。

阅读全文 →
🚀 新品发布

Claude最新模型只对付费用户开放

AIClaude
1.6万2130135

Claude Fable 5 现已在 Computer 中作为编排模型上线。
这是 Anthropic 面向长周期、复杂任务的最先进模型。

该模型仅对 Computer 的 Pro 和 Max 订阅用户开放。

在 X 看原帖 ↗

一个非营利组织刚成立,专攻超级智能对齐

AI对齐超级智能
8.4万106683277

我们正在成立一家新的非营利性对齐研究组织——⊢ Sequent Research,汇聚此前在英国人工智能安全研究所(UK AISI)对齐团队、Timaeus 以及其他机构从事相关工作的研究人员,共同开展超级智能对齐研究。我们正在招聘! 🧵

在 X 看原帖 ↗

终端里跑的AI编程搭档,免费配百万上下文模型

AI编程开源工具
4034262

🚀 MiMo Code V0.1 现已上线并开源!
它不只是终端里的 AI 编程助手——而是你将合作过的最聪明的编程搭档。

它搭载 MiMo V2.5,这是一款多模态模型,限时免费提供,支持百万 token 上下文窗口——随时待命。

在 X 看原帖 ↗

AI在帮区块链找漏洞——不是未来,是现在

AI安全区块链
3.7K161376

解释 Monad Bugfinder:我们正在使用的内部 AI 辅助漏洞发现系统,用于帮助保障 Monad 区块链的安全。 附有直播链接。 博客文章:

在 X 看原帖 ↗
📰 行业动态

Claude Design 其实是个能直接跑在浏览器里的 AI 助手操作系统

AILAUNCH
1.4万788110

Claude Design 有一个完整的 Agent 运行环境,如果把它跟 Claude Code 比较的话,只是它基于浏览器和虚拟机来构建的。它有45个工具,有24个内置skills。运行方式也是基于 Agentic Loop。

所以它就是一个完整的 Agent Harness。

在 X 看原帖 ↗

企业微信突然能被 AI 当后台系统直接操作了

AITOOL
5.0K38646

企业微信自动化,一个挺实用的开源库:wecom-cli ​它不是做 Chatbot,是把企微的日常办公动作封装成 AI Agent 的 Skills(工具)。 目前支持: 1.​通讯录查询 & 发消息 2.​日程查询 & 创建会议 3.​待办管理 4.​文档和智能表格的读写 5.​这就把企微从一个聊天软件变成了 AI 可以直接操作的后台系统。 ​有相关开发需求的可以看看:

在 X 看原帖 ↗

Linux 开发者正用 AI 给老款 AMD 显卡续命

AIEXPERIENCE
7.7K2416321

Linux 开发者正在使用 AI 辅助编程(vibe coding)来维持老旧 AMD GPU 的生命力

在 X 看原帖 ↗

工薪阶层孩子玩 SOTA 模型,可能像买不起江诗丹顿一样自然

AIOPINION
2.6万116515

服了你们了,anthropic,Claude一有什么事,就AT我做达里奥新视频,我也很想做,没时间啊,兄弟,我还要分精力搞LLM,后面还有各种服务器benchmark,尽可能保证闲暇之余给大家更新!做AI视频真不是我主业,纯瘾大。新模型还没时间用,但我估计工薪阶层家的孩子会越来越玩不起SOTA模型,这个就像玩儿表一样的,你以为积家是顶了,高端的江诗丹顿门你都摸不到,达里奥正在试图用模型给人类分级,我们的AI社会地位正在拉开差距。

他会为此付出代价。

在 X 看原帖 ↗

说‘换便宜模型省钱’,其实是在用更差的工具做同一件事

AIOPINION
6.1K612813

“切换到更便宜的模型以节省成本”本身就是一个问题,因为更便宜的模型性能更差(也许对某个特定用途来说已足够好,但依然更差)。

更常见的更好做法是采用模型层级结构:由更智能的模型担任协调者与审核者,来调度和监督更便宜的模型。

在 X 看原帖 ↗

600 多篇论文正把 LLM 塞进网络安全的每个检查点

AIRESEARCH
2.8K268882

超赞的 LLM4Cybersecurity:600 多篇关于 AI 驱动网络安全的研究论文 🛡️💀 🤖
当大语言模型(LLM)遇上网络安全。

该仓库整理了 600 多篇研究论文,涵盖 AI 驱动的漏洞检测、威胁情报、网络防御、进攻性安全、模糊测试(fuzzing)以及自主安全代理等方向。

🔗 #LLM #CyberSecurity #AIResearch #ThreatIntel #GenAI #OpenSource

在 X 看原帖 ↗

Claude Fable 5发布,附带系统卡PDF

ClaudeAnthropic

System Card [pdf]:https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c3...

社区讨论:多数用户确认Fable 5在代码任务(如MicroPy库开发)和Pelican基准测试中显著强于Opus 4.8。@simonw提供多组实测链接佐证性能提升,@bkjlblh和@mohsen1则指出模型主动拒绝LLM相关提问(如解释论文、设计训练管道),因Anthropic新增“前沿LLM开发干预”机制。@frevib质疑命名营销策略未带来实质进步,@pietz和@caleblloyd聚焦商业影响:6月23日后需用量信用,企业API成本或达2万美元/月,接近资深工程师年薪。

在 HN 看讨论 ↗   原文 / 论文 ↗

文本生成快了4倍,用的是扩散模型

AI文本生成

DiffusionGemma: 4x Faster Text Generation

社区讨论:多人指出扩散模型在边缘设备(如手机、本地GPU)上优势显著,因无需逐token自回归解码,适合低延迟场景(@samuelknight);但也有用户质疑其实际质量,称本地扩散模型“明显不如廉价API模型”,不愿为速度牺牲质量(@SkitterKherpi)。@LarsDu88追问扩散文本模型相比自回归模型的固有缺陷,而@minimaxir则基于硬件对比图质疑“高成本”传言,认为DiffusionGemma在同等H100下应不更贵。

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude企业版强制存30天数据

AI合规企业服务

链接无效:该 URL 无法访问。

社区讨论:多人指出企业版强制30天数据留存实际意味着Anthropic可无限期保留数据,因条款写明“几乎所有情况下30天后删除”,留有自由裁量权(@pseudosavant);有人认为风险本质在于“使用即上传”,只要接受数据外传就已构成隐患(@keithnz);另有开发者质疑这可能直接违反NDA(@thekevan),并已紧急将所有代理设为data retention mode 'none'以规避(@pbgcp2026)。

在 HN 看讨论 ↗   原文 / 论文 ↗

每次打开Claude桌面版,都白占1.8GB内存

ClaudeHyper-V

Claude Desktop 每次启动都会生成一个 1.8 GB 的 Hyper-V 虚拟机,即使仅用于聊天场景。

社区讨论:多人批评Claude桌面版强制启动10GB VM并常驻1.8GB内存,且无禁用选项(@tom1337、@nathanyz);@cortesoft反问“无法停止难道不是好事”,遭@HypnoticOcelot指出逻辑矛盾;@dbmikus则为VM设计辩护,称微虚拟化是沙箱化AI代理的未来方向;@tkcranny直言应用启动慢、交互卡顿,“与其宣传严重不符”。

在 HN 看讨论 ↗   原文 / 论文 ↗

一分钱转账就能黑掉银行AI代理

AI安全金融AI

一笔仅 0.01 欧元的银行转账,就可能危及一个银行 AI 代理。

社区讨论:多数人指出LLM将交易描述误判为指令是根本性缺陷,@EnglishRobin96称“只要存在此问题,LLM就永无安全可言”;@zkmon质疑为何需用LLM解析确定性交易数据;@nerder92则认为攻击需用户主动点击恶意链接、接收陌生转账并主动查询,实际门槛较高;@reddalo类比SQL注入回归,@bilekas直斥将AI置于未经请求的财务决策中属严重失职;@nticompass反讽“唯一解是移除AI代理”。

在 HN 看讨论 ↗   原文 / 论文 ↗

安全研究员集体吐槽Anthropic新模型的护栏

AI安全大模型

Anthropic发布Fable模型,网络安全研究员公开批评其内置限制——这些限制影响他们测试模型真实行为的能力。

阅读全文 →

Claude Code配额直接挂菜单栏了

macOSClaude Code

Show HN:适用于 macOS 菜单栏的 Claude Code 配额计量器

社区讨论:多人批评Claude Code未在底部状态栏显示配额百分比,如@giancarlostoro要求“Weekly Quota Left: 99%”提示;另有用户指出会话未自动压缩导致配额耗尽过快。@artdigital质疑通过curl+bash脚本安装的安全风险,强调应提供直接下载或Homebrew安装。工具选择存在分歧:@rippeltippel和@fosron力推CodexBar(支持多模型),@tskulbru用Linux原生ClaudeBar,@ceritium则自建独立配额监控页。

在 HN 看讨论 ↗   原文 / 论文 ↗

AI代理终于能安全跑Lua脚本了

AI代理沙箱

Lua.ex:基于 BEAM 的沙箱化 Lua 5.3,专为 AI Agent 构建 · Lua.ex

在 HN 看讨论 ↗   原文 / 论文 ↗

Apache Burr:让AI代理不再乱跑

AI agentApache

Apache Burr:构建可靠的 AI 智能体与应用程序

社区讨论:多人质疑Burr的Apache项目身份与设计风格,@flakiness对比其“非典型”首页与Apache HTTP Server官网,@redlewel批评其“vibeslopped”落地页和“700+ Discord成员”缺乏技术可信度。@tcdent指出Python装饰器被误用于流程控制而非本意的函数过滤(如缓存、序列化),批评FastAPI式用法泛滥。@hbarka和@hmokiguess分别提出与DSPy、Strands Agents的横向对比需求,反映开发者正权衡不同框架在状态管理、平台锁定与易用性间的取舍。

在 HN 看讨论 ↗   原文 / 论文 ↗
⚡ 实战经验

AI开始反向审问你:42个词撬动需求确认

AI协作开源项目
3.1K105352

有位老哥把自己几十年的工程实战经验一股脑塞进了这个开源项目,直接冲上GitHub热榜第一,狂揽12.4万Star。作者是前Vercel工程师,参与过Next.js早期开发,整理了16个和Claude协作的实战技巧,一条命令装完。最绝的是Grim这个skill——让AI反过来审问你,顺着决策树一条条确认需求,搞清楚你要什么再动手。

就42个词,被人称为“token回报率最高的提示词”。还有专治代码跑不起来的skill,强制AI先写必败测试,再写最少代码让它过,经典红绿循环,AI想偷懒都没机会。地址:

在 X 看原帖 ↗

Codex+GPT-5.5能变成持续干活的开发系统

TUTORIALCodex
2.2万104483587

Open AI 曾官方点名的Codex 视频 值得收藏,不到 2 小时,把 Codex + GPT-5.5 这套组合讲得很实: - 技能怎么配。- 插件怎么用。- 自动化工作流怎么搭。

- 多任务怎么并行跑。- 以及最关键的,怎么把 Codex 从一个聊天窗口,变成一个可以持续帮你干活的开发系统。真正高效的方式,是你先把上下文、技能、流程、权限、任务边界搭好,然后让 AI 在一个更稳定的工作环境里执行。

在 X 看原帖 ↗
📌 其他

3%的注意力头一关掉,AI逻辑推理就崩了

Mechanistic InterpretabilityLLM推理
2.7万82379264

Llama-3.1-8B等模型中约3%的Attention Head被关闭后,ProntoQA正解率跌至44.6%,接近随机猜测水平。

阅读全文 →

Minerva获2000万美元A轮融资,推出AI客户意图理解平台

AI商业营销
110.2万3551.8K1.3K

Minerva宣布完成2000万美元A轮融资,联合OpenAI推出可实现超个性化营销的AI客户洞察平台。

阅读全文 →

METR评估发现超半数SWEBench结果不可合并

AI评估工程
17.8万76771381

终于发布了!!!
@METR_Evals 发现,SWEBench 中超过一半的结果是无法合并的“垃圾代码”(slop)。

FrontierCode 代表了维护者验证过的、超 1000 小时的软件工程工作,绝大多数前沿模型目前尚无法解决其中的问题,更不用说以高质量方式解决了。

Cog had IOI

在 X 看原帖 ↗

开发者因AI API账单过高转向本地部署AI编程

AI工程开源
18.6万67482591

很多开发者最痛的不是不会用 AI。是 AI 越用越爽,账单越看越想死。有个开发者 10 天就干出 170 美元 Claude Code 账单,结果评论区有人直接给了一个狠方案:别继续烧 API 了,买台 Mac mini,把 AI 编程小队搬回本地。

基础款 Mac mini M4,599 美元。装 Ollama,拉本地模型,跑几条命令,然后把

在 X 看原帖 ↗

PoeticHQ发布新AI系统:多小时复杂任务准确率超99%

AI商业工程
8.2K2310433

PoeticHQ推出一款新型AI系统,可执行持续数小时的复杂任务,准确率达99%以上,所需token数量比当前AI代理减少10倍。

该公司已从Kleiner Perkins、Founders Fund、First Harmonic和Genius Ventures获得5000万美元融资,估值5亿美元。

融资将用于构建能在《财富》500强企业内部执行复杂工作的AI系统。

彭博社报道了PoeticHQ的相关消息。

PoeticHQ正在招募人才,目标是让AI在世界顶级企业中完成真实工作任务。

在 X 看原帖 ↗

Kyutai实验室用强化学习优化全双工语音模型交互性

AI语音模型强化学习
1.3万29179117

Kyutai实验室发布新论文《全双工语音模型中的多维度交互对齐》。团队使用强化学习(RL)对语音模型Moshi和PersonaPlex进行后训练,使其更接近人类对话行为:准确判断何时回应、何时静默等待、何时在倾听时以‘yeah’或‘okay’等方式进行副语言反馈(backchanneling)。

全双工语音模型(如Moshi和PersonaPlex)理论上比传统轮替式(turn-based)语音模型更自然,但实践中仍存在明显问题:该说话时不说话、不该说话时插话、缺乏副语言反馈。

问题根源之一是监督学习中使用的词元级(token-level)损失函数。例如,模型选择静默而非发出‘yeah’这类反馈,在交叉熵损失中代价极低,但人类听感上却显著不自然。而强化学习后训练可直接建模序列级目标,例如“每隔一段时间进行一次副语言反馈”。

该方法已应用于Moshi和NVIDIA开发的PersonaPlex模型,所有评估指标均获得提升。评估采用Full-Duplex-Bench v1(向模型输入预录制音频)和v2(模型参与实时多轮对话)两个版本基准测试。

在 X 看原帖 ↗

新方法QGF优化扩散策略训练,避开BPTT不稳定性

AI强化学习扩散模型
3.3万61644590

扩散模型(或流模型)能生成优异的策略,但用强化学习(RL)训练它们 notoriously 困难:反向传播通过时间(BPTT)不稳定,而对扩散过程直接应用RL会严重拉长有效决策步长(horizon)。

在新论文中,研究者展示了如何通过一种“奇特技巧”——“近似”雅可比矩阵(Jacobian)——来优化流匹配(flow matching)策略。相关链接:

该方法名为QGF(Q-function Gradient Flow),在实验中优于使用真实雅可比矩阵或BPTT的方案。QGF是纯测试时(test-time)方法:策略本身通过行为克隆(BC)训练,Q函数通过时序差分(TD)训练;在测试阶段,仅用恒等矩阵(identity Jacobian)作为雅可比矩阵的近似,对Q函数关于动作进行优化。链接:

更多细节见论文及项目网站: 和 @jtspringenberg 合作完成。

在 X 看原帖 ↗

Anthropic发布Claude Fable 5引发安全政策不一致争议

AI安全商业
2.3万4434163

Natolambert在𝕏平台发文质疑Anthropic在发布Claude Fable 5时采取的不均衡安全政策。

他认为,这种不一致的安全策略削弱了更广泛AI社区的凝聚力。

他还指出,该做法加速了AI在短期内演进过程中的不确定性与风险。

Natolambert在文末说明,自己过去几天身体不适,因此这篇博文是在快速写作状态下完成,若有疏漏请予体谅。

在 X 看原帖 ↗

Claude Code爬虫手册:5个开源工具让AI直接操作网页

AI开源工程
6.8K97856

Claude Code终极爬虫手册:5大开源Skill让AI真正会上网干活。

想让Claude别再只是聊天工具,而是直接上手抓数据、操作网页、批量处理内容?下面这套组合就是最实用的方案。

方案整理成这份手册,可直接复制给Claude Code、Cursor、Codex使用。

顺序从日常最常用排到重度操作,零门槛。

1. 日常80%需求:社媒与公开内容一键抓取
工具:Agent-reach
地址:

在 X 看原帖 ↗

Claude Fable 5 可直连本地 Ansys 2026 R1 完成威尔金森功分器仿真

AI仿真EDA
1.5万28186138

Claude Fable 5 AI仿真工程能力有多强?我给Claude发了一段用Ansys Electronics做一个3 GHz的威尔金森一分二功分器仿真需求,剩下的活全是它干的。

它通过我开发的AEDT MCP插件,直连我本机安装的Ansys Electronics Desktop 2026 R1软件。

连接建立后,Claude Fable 5自动执行全部仿真准备步骤:新建工程、定义介质板材料、绘制微带线结构、镜像生成对称支路、添加隔离电阻、设置端口、施加辐射边界条件,并启动求解器运行仿真。

在 X 看原帖 ↗

Fable 5单条prompt生成成都3D游览地图

AI工具地理信息
1.1万84532

Fable 5真的很厉害!我只用一条prompt做了成都市中心3D游览地图,人民公园,安顺廊桥,太古里,宽窄巷子……本成都人看着都想家了。

prompt内容为:为成都中心城区创建一个3D可自由探索的地图plan.md文件。设计plan.md时,要加入在进入下一步前必须先检查的循环机制。

该成果由@StarchildOnX AI Agent制作,链接为

在 X 看原帖 ↗

LangSmith推出免费课程教用户监控AI代理成本与性能

AI工程开源
4.3K54514

LangSmith可帮助用户追踪AI应用运行成本,通过链路分析(trace analysis)发现性能趋势,并监控输出质量与响应延迟。

LangChain团队为此开发了一门完整课程,逐步讲解LangSmith在全栈场景中的使用方法。

用户可免费报名LangChain Academy的这门课程,学习如何在生产环境中监控并优化AI代理(agents)。

在 X 看原帖 ↗

用户用4个AI代理自动管理加密投资组合

AI加密货币自动化
1.3K832

我有4个AI代理在我睡觉时为我的投资组合工作:一个读取资金费率;一个标记正在抛售代币的钱包;一个为我草拟社交平台帖子;一个在我犯错时提醒我。

这四个代理每月花费的成本,比多数人买咖啡的月支出还低。

人们仍以为竞争优势藏在某个秘密的Discord群组里。

链接:

在 X 看原帖 ↗

创始人正为可免费获取的软件付费

创业开源商业
3.1K35958

大多数创始人正在为本可免费获取的软件付费。许多此类服务无需风险投资支持即可使用: → @Cloudflare 提供托管服务,最高额度达25万美元; → @msft4startups 提供云服务与AI资源,信用额度为5000至15万美元; → @AWSstartups 提供云服务信用额度,为5000至10万美元; → @Atlassian 提供项目管理与运维工具,免费使用期为12个月。 文中附带8个链接,其中1个为额外补充链接。

在 X 看原帖 ↗

Base App上线10天已收近1000份联盟计划申请

商业Web3增长
1.2K1403

我本周正在审核近1,000份Base App联盟计划(affiliate program)申请,此时距该计划启动仅过去10天😅。

申请者类型多样:包括小型创作者、大型KOL(关键意见领袖)、实用工具类网站、广告网络以及加密货币交易平台。

真正重要的不是规模或渠道类型,而是申请者的受众质量,以及其与@baseapp的实际契合度。

在 X 看原帖 ↗

Fable 5 擅长 Three.js 开发,生成一款受《佛莱迪的五夜后宫》启发的游戏

AIWeb开发游戏
8516

Fable 5 擅长 Three.js 开发。开发者使用最大推理强度,模型持续运行直至自认为代码已达到完美状态。

该游戏灵感来自《佛莱迪的五夜后宫》(FNAF)。

游戏链接为:

据开发者估算,该项目开发成本约为 49.80 美元。

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

08:34 更新9 篇

跨产品如何控制Claude:环境隔离与爆炸半径管理

通过环境层隔离限制AI代理的爆炸半径,并分享实际部署中的安全教训。
www.anthropic.com 安全工程AI

Anthropic推出托管AI代理服务,数天完成原型到生产

开发者只需定义任务和工具,即可快速部署自主执行多步骤的AI代理,无需管理基础设施。
Claude AI工程商业

Grok被指故意忽略安全测试,举报工程师遭解雇

前工程师Devin Kim起诉称,多次提醒Grok存在歧视和危险信息风险后遭解雇,用户可能正使用未经充分安全检查的AI。
TechCrunch AI安全商业

Datadog老兵创办AI编码初创公司Niteshift,押注对抗大模型厂商锁定

前Datadog工程师创立Niteshift,获700万美元种子轮,主打模型无关的编码基础设施。
TechCrunch AI工程商业

他们用AI生成评论伪装网民,专批数据中心电费和关税

OpenAI封禁疑似来自中国的账号集群,批量输出评论和图片试图影响美国AI政策辩论。
OpenAI 安全AI商业

写代码时AI建议零延迟?背后是Blackwell芯片在支撑

Cursor与Together AI用NVIDIA Blackwell芯片构建实时推理基础设施,让AI提示跟上你的编辑速度。
𝕏 @togethercompute AI工程基础设施

装AI代理像装普通软件一样简单,还带语音控制

Hermes Agent推出桌面应用,支持Windows/Mac/Linux,仪表盘管理模型、日志和技能,新用户可用免费模型零成本体验。
𝕏 @JulianGoldieSEO AI工程开源

对电脑说句话,它直接动手建应用和网站

与普通语音助手只动嘴不同,这款系统能执行操作,实时预览结果。
𝕏 @JulianGoldieSEO AI代理系统语音交互

Odysseus AI PewDiePie:开源本地AI工作区工具

它不是AI模型,而是可本地运行的开源工作区层,支持连接本地模型或云API,提供聊天、智能体、深度研究、模型对比等功能。
𝕏 @JulianGoldieSEO AI开源工程
查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部