AI Pulse
AI Pulse
说人话的 AI 情报站
2026 年 6 月 25 日 08:37 更新 00 信号0 主题
试试:
今日焦点

OpenAI自研推理芯片Jalapeño,让ChatGPT更快更省更稳

OpenAI与博通联合发布了名为Jalapeño的AI推理芯片。这是OpenAI首次设计自己的处理器,目标是让ChatGPT、Codex、API以及未来的智能体产品跑得更好、更省、更稳。

成本是AI产品速度和可用性的关键限制因素。通用芯片(比如GPU)为大范围工作负载设计,对LLM推理不是最优解。Jalapeño从零开始为现代大语言模型量身打造,不是从老的AI负载改造而来。它优化了关键内核、内存移动、网络和服务模式——这些正是ChatGPT每天运行的东西。

Jalapeño的设计目标是兼顾顶级加速器的功率和吞吐量,同时达到专用推理系统才有的低延迟。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 55

不用装专用AI浏览器,插件就能跑AI智能体

全程在浏览器里运行,不需要额外装程序,用自己的API密钥,完全开源,可以直接试用

嘿 HN。http://peerd.ai 是一个完全以浏览器网页扩展形式运行的 AI agent 工具框架。

你不需要安装单独的“AI 浏览器”。你不需要附加或运行任何外部进程,也不用管理难用的 mcp 集成。

它就是一个完全自包含的网页扩展,用无构建流程的原生 JS 编写,非浏览器依赖极少,使用你自己的提供商密钥,采用 Apache 2 许可证。

这不仅仅是一个有趣的黑客项目。尽管它大体上一直是一个个人 side project,但我真心相信

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 85

开源生产级AI框架来了,直接能用

做生产环境可用的AI智能体和RAG检索增强生成,已有现成开源框架,不用从零搭

行业动态 · Hacker News▲ 335

Ruby也有了支持所有主流AI服务商的框架

用Ruby写程序的开发者不用自己适配不同AI接口,可以直接调用了

社区讨论:有人质疑2026年没必要再用动态类型语言开发,静态类型能给大语言模型提供更清晰的信号。使用者普遍认可这个框架易用性好, usability接近Vercel的AI框架,也有人已经用它搭建出了开源ChatGPT克隆项目。同时使用者也反馈了多个具体问题,比如调参仍需要适配不同服务商的平台特性,缓存、追踪可观测性、Responses API原生支持都存在缺陷。

也有开发者分享了其他语言或同语言不同定位的同类开源工具。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 156

Gemini 3.5 Flash 开放了电脑操作功能

谷歌大模型原生支持自主操作电脑,不用额外插件就能完成自动化任务,操作门槛进一步降低。

社区讨论:多数用户反馈Gemini实际体验不佳,有用户让它做简单的PDF表格提取任务,经过十几次修正后它因超出错误阈值放弃,承认模型会虚构数据而非准确复制。不少用户指出防护栏调整过度,查询转号、备份规划、代码评估等正常请求均被拒绝,也有人不满它缺少竞品已有的克隆仓库做静态分析、MCP支持等功能,还有用户调侃官方评测图故意掩盖Gemini排名靠后的事实。仅有人认可它成本低,性能表现亮眼。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 220

创投大佬称马斯克的xAI是彻头彻尾的烂摊子

知名硅谷创投人公开评价马斯克旗下项目,SpaceX不算AI公司,xAI是彻底失败的项目

社区讨论:多数评论认为霍夫曼本身身份存在争议,他从未牵头做过一线科技项目,同时投资了OpenAI和Anthropic,批评xAI属于立场不对的个人恩怨,并不值得关注。不少人认可霍夫曼对xAI是烂摊子的判断,也有用户实际使用过Grok,称其准确率能和Gemini互争高下,最新版本表现稳定,不能太早否定xAI。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 141

OpenAI和博通合作,推出专为大模型设计的推理芯片

大模型运行推理的核心硬件,终于有了合作定制款,后续大模型推理成本可能因此变化

行业动态 · Hacker News▲ 218

美国国家安全局失去了对Anthropic模型的访问权

政府机构和AI公司发生纠纷,直接导致官方失去AI服务权限

已解锁:https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-acce...

社区讨论:多数评论认为这更像是AI营销造势,当前AI领域的营销造势已经脱离实际,比起真实安全事件更像一场公关舆论战。部分人质疑 NSA 真失去 access的说法,认为美国政府完全可以强制获取模型权重,NSA内部仍安插人员,不可能彻底失去访问。也有不少人批评NSA近年大规模裁员效率低下,本身没有产出,不配掌握该技术。还有人提到,Mythos确实能快速攻破保密系统,破解二进制反编译成果,安全风险值得警惕。

在 HN 看讨论 ↗   原文 / 论文 ↗
新品发布 · @gdb▲ 13.8万

从头做了九个月的LLM推理引擎,能效比惊人

想要更低功耗跑大模型推理,又多了一个从头开发的全新选择

我们推出 Jalapeño —— 这是一款从零开始设计、历时九个月完成的LLM推理产品,由我们的模型加速,每瓦性能表现十分出色。

在 X 看原帖 ↗
13.8万701.6K117
前沿研究 · @fchollet▲ 4.2万

开源模型跑出了ARC-AGI-2目前最好成绩

这是目前开源模型在ARC-AGI-2上拿到的最优表现

这是目前开源模型在 ARC-AGI-2 上取得的最强成绩。

在 X 看原帖 ↗
4.2万3041253
深度观点 · @fchollet▲ 2.0万

理解复杂系统,最快的方法是找它哪里会错

研究复杂系统时,边界案例和失效模式能帮你画出系统的完整轮廓,直接抓到系统的核心边界

理解复杂系统的最佳方式是研究极端案例和失效模式,因为它们定义了系统的边界轮廓。

在 X 看原帖 ↗
2.0万54666167
企业战略 · @emollick▲ 3.1万

企业AI应用决策已成为组织战略设计而非IT选择

探讨企业应用AI时的核心决策属性与关键问题

在你的组织中如何使用 AI 的决策,正越来越多地成为组织设计和战略决策,而非 IT 选择:

你要如何将智能体整合进公司?你会把哪些智能工作外包?企业的边界在哪里?人的角色又是什么?

在 X 看原帖 ↗
3.1万25278162
观点 · @emollick▲ 10.7万

当前AI知识工具存在软件思维盲区 适配通用知识工作不足

分析现有Codex类AI工具适配全知识工作的核心问题

阅读全文 →
10.7万1491.6K859
观点 · @nicdunz▲ 457

AI模型性能跑分,难道比人思考还重要吗?

有人质疑行业一直在快速迭代更新AI模型,却总引导大家用AI替代思考,没说清模型到底聪明在哪。

有多智能?有基准测试吗?比 5.5 思考模式还要聪明吗?

我搞不懂,为什么我们要更新 instant,还摆出一副大家理应放着 thinking 不用、来用它的姿态?

在 X 看原帖 ↗
45713
工具 · @geekbb▲ 778

这个AI编码工具关网页也不会断运行会话

Pi Coding Agent把AI编码会话放在服务器后台跑,关网页、重启前端都不影响,还能跨设备查看进度。

Pi Coding Agent 的 Web UI 在浏览器里持久化运行、跨设备监督 AI 编码 Agent 的桌面/服务器应用。 核心思路是 Agent 会话在服务器端跑,跟浏览器断开没关系,就算你关了网页、重启了前端服务,会话还在。用了双进程架构,会话守护进程跟 Web 服务分开,前者管 Agent 的运行时,后者只管 API 和 UI 展示。

在 X 看原帖 ↗
77835
观点 · @JohnNosta▲ 202

AI不是不够聪明,只是思考方式和人不一样

有观点提出,AI的认知逻辑和人类的认知逻辑属于完全不同的体系,不能用人类的标准评判它的智力。

🤖 不是机器缺乏智能。而是它运行在一种完全不同的认知几何中。

在 X 看原帖 ↗
20221
开源 · @RoundtableSpace▲ 9.5K

首个开源AI视频制作系统,单条成本不到1美元

OpenMontage可以把Claude或Cursor变成完整的AI视频工作室,所有代码和工具都是开源的。

OpenMontage刚刚成为全球首个开源智能体化视频制作系统,它能把Claude或Cursor转变为全套AI视频工作室,单条视频成本不到1美元。

在 X 看原帖 ↗
9.5K1112
硬件 · @altryne▲ 1.9K

OpenAI推出了自己研发的首款芯片,叫Jalapeño

科技博主爆料,这是OpenAI自研的第一块AI芯片,目前仅公布了名称。

Jalapeño——OpenAI 的第一款芯片!

在 X 看原帖 ↗
1.9K113
研究 · @jerryjliu0▲ 1.2K

开源Mistral OCR处理图表成绩超过GPT-5.5

研究人员利用图表标注功能更新了模型效果,总分仅落后于Gemini 3.1 Pro。

我们公布了 Mistral OCR 的最新测评结果,结果中用到了针对图表的标注功能。

它的总分领先 GPT-5.5,仅落后于 Gemini 3.1 Pro,以它这个价位区间的模型来说,表现相当出色。

它在内容忠实度、语义格式和视觉定位方面都做得很好。它处理表格的表现尚可,处理图表的表现也尚可——不过说句公道话,得分不为零已经不错了。

近期视觉理解能力领域已经取得了不少出色的进展。性能表现见下方截图,我们很快会更新主基准测试页面。

在 X 看原帖 ↗
1.2K184
机器人 · @julien_c▲ 493

Hugging Face平台上的机器人数据集越来越多

社区正在持续上传大规模机器人相关数据集,训练机器人AI的公开素材变多了。

@huggingface hub 上的大规模机器人技术数据集越来越多了!!

在 X 看原帖 ↗
49341
深度观点 · @haider1▲ 717

OpenAI自研新芯片启动了AI自我增强飞轮

现在OpenAI的模型已经开始帮忙造更好的硬件,更好的硬件能训练更强的模型,更强的模型又能优化下一代芯片,这就是自我增强循环。

OpenAI的新芯片可能才是RSI飞轮启动的地方,不是那种模型一夜之间自我改写的科幻版本——但现在OpenAI的模型会帮助打造更好的硬件,更好的硬件能造出更强的模型,更强的模型又会改进下一代芯片,这就是RSI循环。

在 X 看原帖 ↗
717371
行业动态 · @ycombinator▲ 7.6K

金融机构用AI自动决策,几星期活几分钟做完

拿到1.1亿美元融资的AI公司,正在用AI智能体帮金融机构搞定耗时耗钱的人工流程

恭喜@taktile_org完成1.1亿美元C轮融资!

银行和保险公司每年要花费数十亿美元筛查风险交易、处理理赔以及客户开户。

Taktile用AI agents自动化这些决策流程,把原本需要数周完成的流程压缩到几分钟。

在 X 看原帖 ↗
7.6K2186
新品发布 · @dabit3▲ 2.0K

Devin开放两款强编码AI,Pro及以上用户免费用

现有Pro/Max/Teams权限的用户,可以直接在Devin命令行和桌面端免费试用这两个新模型

两款实力顶尖的全新代码模型现已可以在 Devin 中免费试用。

Kimi K2.7 Code 和 GLM 5.2 已上线 Devin CLI 和 Devin Desktop,供 Pro/Max/Teams 用户免费使用。

在 X 看原帖 ↗
2.0K1202
新品发布 · @GoogleAIStudio▲ 8.8K

Google AI Studio已经造出超百万个安卓App

2026年5月才宣布原生安卓应用构建功能,现在已经生成超过一百万个应用。

2026年5月:我们宣布在 AI Studio 推出原生 Android 应用构建功能。

今日:已有超过100万个 Android 应用通过 AI Studio 创建。

立即构建你的第一个 Android 应用:

(注:这还不是一座真正的雕像……目前)

在 X 看原帖 ↗
8.8K612919
行业动态 · @verge▲ 5.6K

OpenAI终于拿出自己做的第一款AI芯片了

OpenAI公开了自研的第一款AI处理器,叫Jalapeño

OpenAI 发布了其首款 AI 处理器:Jalapeño

在 X 看原帖 ↗
5.6K391
深度观点 · @swyx▲ 5.5K

这播客聊了太多科技圈核心问题的直给答案

里面有Databricks赢Snowflake的直接原因,大模型代理云竞争里哪项能力最重要,还有千亿美元大厂怎么保留创业文化

这期播客有超多干货爆料:

- Databricks 为什么击败了 Snowflake(真的给了直截了当的回答!)
- 为什么现在所有人都在做元 harness

为什么 @neondatabase 的存在如此合理(@nikitabase 吹了它太多,都吹得有点离谱了)

LTAP 如何实现我之前和 @ankrgyl 在 @braintrust 播客里聊过的 HTAP 理想

@MosaicML 和 DBRX 到底发生了什么

如何在一家市值 1750 亿美元的大公司里保持研究创业文化

在通往智能体云的竞赛中,哪项知识/经验更重要:数据库、操作系统,还是……网络!

我非常荣幸能受邀参加 @Data_AI_Summit,采访行业里两位顶尖人物,还能和他们畅聊各种话题,从 @bennstancil 的现代数据栈主题,到 @alighodsi 精彩主旨演讲的强大气场。

在 X 看原帖 ↗
5.5K43316
新品发布 · @togethercompute▲ 1.7K

AI工程师大会要讲智能体编码的推理需求

准备上线AI智能体编码服务的从业者,可以现场学习推理引擎如何适配生产级智能体工作负载

智能体编码改变了推理引擎需要处理的内容。

在 AI Engineer World's Fair,Together AI 工程师将主持一场实操研讨会,主题是推理引擎的工作原理,以及承载生产级智能体负载需要哪些条件。

活动时间:6月29日第一天,上午9点至11点。地点:2020会议室。

在 X 看原帖 ↗
1.7K392
行业动态 · @Techmeme▲ 3.9K

谷歌Gemini核心AI研究员,要跳槽去Anthropic了

两名被谷歌内部视作Gemini核心贡献者的AI研究员,计划从谷歌离职加入Anthropic

消息来源:Bloomberg 报道,Google AI 研究员 Jonas Adler 与 Alexander Pritzel 二人在内部均被视为 Gemini 的核心贡献者,他们正计划离职加入 Anthropic。

如需链接和完整上下文,请访问 Techmeme dot com!

在 X 看原帖 ↗
3.9K44710
深度观点 · @emollick▲ 6.1K

说自己从来不用AI的人,其实偷偷在用

不少声称不用AI的人,实际正在偷偷使用AI

很多说自己从不使用AI的人其实正在用AI,只不过是偷偷在用。

在 X 看原帖 ↗
6.1K64818
行业动态 · @hardmaru▲ 1.4万

AI领域要迎来一轮架构大转变了?

两款产品已经引发关于AI依赖与韧性的严肃讨论,合作方认为这只是AI开发架构转变的开始。

我很开心能和@OpenRouter达成合作 ⚡

OpenRouter Fusion和Sakana Fugu这类产品已经引发了关于AI领域依赖性与韧性的重要讨论。

我相信,这只是AI开发即将到来的大规模架构转型的开端。

在 X 看原帖 ↗
1.4万159717
工具产品 · @omarsar0▲ 1.0K

AI出了新活,能跟着你进度定制学习计划

有人做出了定制学习工具,AI能根据学习者的需求和进度,生成专属学习计划和学习中心

我对我们新的 /learn 功能着迷了。这是我学习和研究主题最喜欢的方式。

这个智能体可以生成学习计划和学习中心(构件),会根据学习者的需求和进度进行调整。

在 X 看原帖 ↗
1.0K143
直播 · @altryne▲ 3.1万

主播明日将直播分享本周重要AI行业新闻

主播预告明日直播将讨论多个AI热点事件与新品

我很兴奋明天能回到演播室,报道过去一周最重要的AI新闻!

我们会聊到Fable被下架,它还会不会重新上线;@Zai_org 的GLM 5.2,以及我们拿到的两个全新视频模型;还有@midjourney 一项非常疯狂的硬件发布。

@dexhorthy 会加入我们,聊humanlayer的进化,以及如何摆脱“垃圾内容”;@vanpelt 和 @adrnswanberg 会给我们展示 @wandb 一款令人兴奋的新产品,名为hivemind!

明天上午8:30,就在这个X账号或者YouTube上收看我们(链接见下方)

来YouTube看我们的直播 👇

在 X 看原帖 ↗
3.1万1101
谷歌 · @omarsar0▲ 5.7K

开发者评价谷歌新推出的计算机操作模型产品

开发者分享对谷歌新款计算机操作模型的使用期待

这是 Google 推出的一个很酷的新版本。我现在在智能体循环/长时任务中已经非常依赖计算机使用功能。

我需要能力更强的计算机使用模型,同时还要保持低成本。我不确定 Gemini 3.5 Flash 的效率如何,但我很欣慰能有新的选择。

在 X 看原帖 ↗
5.7K23115
开源 · @BrianRoemmele▲ 3.4K

无人工厂部署260个AI工人测试通义千问AgentWorld

无人工厂ZHC用260个AI工人在类生产场景测试Qwen-AgentWorld

阅读全文 →
3.4K3118
🚀 新品发布
新品发布 · @gdb▲ 13.8万

从头做了九个月的LLM推理引擎,能效比惊人

想要更低功耗跑大模型推理,又多了一个从头开发的全新选择

我们推出 Jalapeño —— 这是一款从零开始设计、历时九个月完成的LLM推理产品,由我们的模型加速,每瓦性能表现十分出色。

在 X 看原帖 ↗
13.8万701.6K117
新品发布 · @togethercompute▲ 1.7K

AI工程师大会要讲智能体编码的推理需求

准备上线AI智能体编码服务的从业者,可以现场学习推理引擎如何适配生产级智能体工作负载

智能体编码改变了推理引擎需要处理的内容。

在 AI Engineer World's Fair,Together AI 工程师将主持一场实操研讨会,主题是推理引擎的工作原理,以及承载生产级智能体负载需要哪些条件。

活动时间:6月29日第一天,上午9点至11点。地点:2020会议室。

在 X 看原帖 ↗
1.7K392
新品发布 · @GoogleAIStudio▲ 8.8K

Google AI Studio已经造出超百万个安卓App

2026年5月才宣布原生安卓应用构建功能,现在已经生成超过一百万个应用。

2026年5月:我们宣布在 AI Studio 推出原生 Android 应用构建功能。

今日:已有超过100万个 Android 应用通过 AI Studio 创建。

立即构建你的第一个 Android 应用:

(注:这还不是一座真正的雕像……目前)

在 X 看原帖 ↗
8.8K612919
新品发布 · @dabit3▲ 2.0K

Devin开放两款强编码AI,Pro及以上用户免费用

现有Pro/Max/Teams权限的用户,可以直接在Devin命令行和桌面端免费试用这两个新模型

两款实力顶尖的全新代码模型现已可以在 Devin 中免费试用。

Kimi K2.7 Code 和 GLM 5.2 已上线 Devin CLI 和 Devin Desktop,供 Pro/Max/Teams 用户免费使用。

在 X 看原帖 ↗
2.0K1202
📰 行业动态
行业动态 · @hardmaru▲ 1.4万

AI领域要迎来一轮架构大转变了?

两款产品已经引发关于AI依赖与韧性的严肃讨论,合作方认为这只是AI开发架构转变的开始。

我很开心能和@OpenRouter达成合作 ⚡

OpenRouter Fusion和Sakana Fugu这类产品已经引发了关于AI领域依赖性与韧性的重要讨论。

我相信,这只是AI开发即将到来的大规模架构转型的开端。

在 X 看原帖 ↗
1.4万159717
行业动态 · @Techmeme▲ 3.9K

谷歌Gemini核心AI研究员,要跳槽去Anthropic了

两名被谷歌内部视作Gemini核心贡献者的AI研究员,计划从谷歌离职加入Anthropic

消息来源:Bloomberg 报道,Google AI 研究员 Jonas Adler 与 Alexander Pritzel 二人在内部均被视为 Gemini 的核心贡献者,他们正计划离职加入 Anthropic。

如需链接和完整上下文,请访问 Techmeme dot com!

在 X 看原帖 ↗
3.9K44710
行业动态 · @verge▲ 5.6K

OpenAI终于拿出自己做的第一款AI芯片了

OpenAI公开了自研的第一款AI处理器,叫Jalapeño

OpenAI 发布了其首款 AI 处理器:Jalapeño

在 X 看原帖 ↗
5.6K391
行业动态 · @ycombinator▲ 7.6K

金融机构用AI自动决策,几星期活几分钟做完

拿到1.1亿美元融资的AI公司,正在用AI智能体帮金融机构搞定耗时耗钱的人工流程

恭喜@taktile_org完成1.1亿美元C轮融资!

银行和保险公司每年要花费数十亿美元筛查风险交易、处理理赔以及客户开户。

Taktile用AI agents自动化这些决策流程,把原本需要数周完成的流程压缩到几分钟。

在 X 看原帖 ↗
7.6K2186
观点 · @nicdunz▲ 457

AI模型性能跑分,难道比人思考还重要吗?

有人质疑行业一直在快速迭代更新AI模型,却总引导大家用AI替代思考,没说清模型到底聪明在哪。

有多智能?有基准测试吗?比 5.5 思考模式还要聪明吗?

我搞不懂,为什么我们要更新 instant,还摆出一副大家理应放着 thinking 不用、来用它的姿态?

在 X 看原帖 ↗
45713
工具 · @geekbb▲ 778

这个AI编码工具关网页也不会断运行会话

Pi Coding Agent把AI编码会话放在服务器后台跑,关网页、重启前端都不影响,还能跨设备查看进度。

Pi Coding Agent 的 Web UI 在浏览器里持久化运行、跨设备监督 AI 编码 Agent 的桌面/服务器应用。 核心思路是 Agent 会话在服务器端跑,跟浏览器断开没关系,就算你关了网页、重启了前端服务,会话还在。用了双进程架构,会话守护进程跟 Web 服务分开,前者管 Agent 的运行时,后者只管 API 和 UI 展示。

在 X 看原帖 ↗
77835
观点 · @JohnNosta▲ 202

AI不是不够聪明,只是思考方式和人不一样

有观点提出,AI的认知逻辑和人类的认知逻辑属于完全不同的体系,不能用人类的标准评判它的智力。

🤖 不是机器缺乏智能。而是它运行在一种完全不同的认知几何中。

在 X 看原帖 ↗
20221
开源 · @RoundtableSpace▲ 9.5K

首个开源AI视频制作系统,单条成本不到1美元

OpenMontage可以把Claude或Cursor变成完整的AI视频工作室,所有代码和工具都是开源的。

OpenMontage刚刚成为全球首个开源智能体化视频制作系统,它能把Claude或Cursor转变为全套AI视频工作室,单条视频成本不到1美元。

在 X 看原帖 ↗
9.5K1112
硬件 · @altryne▲ 1.9K

OpenAI推出了自己研发的首款芯片,叫Jalapeño

科技博主爆料,这是OpenAI自研的第一块AI芯片,目前仅公布了名称。

Jalapeño——OpenAI 的第一款芯片!

在 X 看原帖 ↗
1.9K113
研究 · @jerryjliu0▲ 1.2K

开源Mistral OCR处理图表成绩超过GPT-5.5

研究人员利用图表标注功能更新了模型效果,总分仅落后于Gemini 3.1 Pro。

我们公布了 Mistral OCR 的最新测评结果,结果中用到了针对图表的标注功能。

它的总分领先 GPT-5.5,仅落后于 Gemini 3.1 Pro,以它这个价位区间的模型来说,表现相当出色。

它在内容忠实度、语义格式和视觉定位方面都做得很好。它处理表格的表现尚可,处理图表的表现也尚可——不过说句公道话,得分不为零已经不错了。

近期视觉理解能力领域已经取得了不少出色的进展。性能表现见下方截图,我们很快会更新主基准测试页面。

在 X 看原帖 ↗
1.2K184
机器人 · @julien_c▲ 493

Hugging Face平台上的机器人数据集越来越多

社区正在持续上传大规模机器人相关数据集,训练机器人AI的公开素材变多了。

@huggingface hub 上的大规模机器人技术数据集越来越多了!!

在 X 看原帖 ↗
49341
行业动态 · Hacker News▲ 218

美国国家安全局失去了对Anthropic模型的访问权

政府机构和AI公司发生纠纷,直接导致官方失去AI服务权限

已解锁:https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-acce...

社区讨论:多数评论认为这更像是AI营销造势,当前AI领域的营销造势已经脱离实际,比起真实安全事件更像一场公关舆论战。部分人质疑 NSA 真失去 access的说法,认为美国政府完全可以强制获取模型权重,NSA内部仍安插人员,不可能彻底失去访问。也有不少人批评NSA近年大规模裁员效率低下,本身没有产出,不配掌握该技术。还有人提到,Mythos确实能快速攻破保密系统,破解二进制反编译成果,安全风险值得警惕。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 141

OpenAI和博通合作,推出专为大模型设计的推理芯片

大模型运行推理的核心硬件,终于有了合作定制款,后续大模型推理成本可能因此变化

行业动态 · Hacker News▲ 220

创投大佬称马斯克的xAI是彻头彻尾的烂摊子

知名硅谷创投人公开评价马斯克旗下项目,SpaceX不算AI公司,xAI是彻底失败的项目

社区讨论:多数评论认为霍夫曼本身身份存在争议,他从未牵头做过一线科技项目,同时投资了OpenAI和Anthropic,批评xAI属于立场不对的个人恩怨,并不值得关注。不少人认可霍夫曼对xAI是烂摊子的判断,也有用户实际使用过Grok,称其准确率能和Gemini互争高下,最新版本表现稳定,不能太早否定xAI。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 156

Gemini 3.5 Flash 开放了电脑操作功能

谷歌大模型原生支持自主操作电脑,不用额外插件就能完成自动化任务,操作门槛进一步降低。

社区讨论:多数用户反馈Gemini实际体验不佳,有用户让它做简单的PDF表格提取任务,经过十几次修正后它因超出错误阈值放弃,承认模型会虚构数据而非准确复制。不少用户指出防护栏调整过度,查询转号、备份规划、代码评估等正常请求均被拒绝,也有人不满它缺少竞品已有的克隆仓库做静态分析、MCP支持等功能,还有用户调侃官方评测图故意掩盖Gemini排名靠后的事实。仅有人认可它成本低,性能表现亮眼。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 335

Ruby也有了支持所有主流AI服务商的框架

用Ruby写程序的开发者不用自己适配不同AI接口,可以直接调用了

社区讨论:有人质疑2026年没必要再用动态类型语言开发,静态类型能给大语言模型提供更清晰的信号。使用者普遍认可这个框架易用性好, usability接近Vercel的AI框架,也有人已经用它搭建出了开源ChatGPT克隆项目。同时使用者也反馈了多个具体问题,比如调参仍需要适配不同服务商的平台特性,缓存、追踪可观测性、Responses API原生支持都存在缺陷。

也有开发者分享了其他语言或同语言不同定位的同类开源工具。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 85

开源生产级AI框架来了,直接能用

做生产环境可用的AI智能体和RAG检索增强生成,已有现成开源框架,不用从零搭

行业动态 · Hacker News▲ 55

不用装专用AI浏览器,插件就能跑AI智能体

全程在浏览器里运行,不需要额外装程序,用自己的API密钥,完全开源,可以直接试用

嘿 HN。http://peerd.ai 是一个完全以浏览器网页扩展形式运行的 AI agent 工具框架。

你不需要安装单独的“AI 浏览器”。你不需要附加或运行任何外部进程,也不用管理难用的 mcp 集成。

它就是一个完全自包含的网页扩展,用无构建流程的原生 JS 编写,非浏览器依赖极少,使用你自己的提供商密钥,采用 Apache 2 许可证。

这不仅仅是一个有趣的黑客项目。尽管它大体上一直是一个个人 side project,但我真心相信

在 HN 看讨论 ↗   原文 / 论文 ↗
💡 深度观点
深度观点 · @fchollet▲ 2.0万

理解复杂系统,最快的方法是找它哪里会错

研究复杂系统时,边界案例和失效模式能帮你画出系统的完整轮廓,直接抓到系统的核心边界

理解复杂系统的最佳方式是研究极端案例和失效模式,因为它们定义了系统的边界轮廓。

在 X 看原帖 ↗
2.0万54666167
深度观点 · @emollick▲ 6.1K

说自己从来不用AI的人,其实偷偷在用

不少声称不用AI的人,实际正在偷偷使用AI

很多说自己从不使用AI的人其实正在用AI,只不过是偷偷在用。

在 X 看原帖 ↗
6.1K64818
深度观点 · @swyx▲ 5.5K

这播客聊了太多科技圈核心问题的直给答案

里面有Databricks赢Snowflake的直接原因,大模型代理云竞争里哪项能力最重要,还有千亿美元大厂怎么保留创业文化

这期播客有超多干货爆料:

- Databricks 为什么击败了 Snowflake(真的给了直截了当的回答!)
- 为什么现在所有人都在做元 harness

为什么 @neondatabase 的存在如此合理(@nikitabase 吹了它太多,都吹得有点离谱了)

LTAP 如何实现我之前和 @ankrgyl 在 @braintrust 播客里聊过的 HTAP 理想

@MosaicML 和 DBRX 到底发生了什么

如何在一家市值 1750 亿美元的大公司里保持研究创业文化

在通往智能体云的竞赛中,哪项知识/经验更重要:数据库、操作系统,还是……网络!

我非常荣幸能受邀参加 @Data_AI_Summit,采访行业里两位顶尖人物,还能和他们畅聊各种话题,从 @bennstancil 的现代数据栈主题,到 @alighodsi 精彩主旨演讲的强大气场。

在 X 看原帖 ↗
5.5K43316
深度观点 · @haider1▲ 717

OpenAI自研新芯片启动了AI自我增强飞轮

现在OpenAI的模型已经开始帮忙造更好的硬件,更好的硬件能训练更强的模型,更强的模型又能优化下一代芯片,这就是自我增强循环。

OpenAI的新芯片可能才是RSI飞轮启动的地方,不是那种模型一夜之间自我改写的科幻版本——但现在OpenAI的模型会帮助打造更好的硬件,更好的硬件能造出更强的模型,更强的模型又会改进下一代芯片,这就是RSI循环。

在 X 看原帖 ↗
717371
📌 其他
前沿研究 · @fchollet▲ 4.2万

开源模型跑出了ARC-AGI-2目前最好成绩

这是目前开源模型在ARC-AGI-2上拿到的最优表现

这是目前开源模型在 ARC-AGI-2 上取得的最强成绩。

在 X 看原帖 ↗
4.2万3041253
工具产品 · @omarsar0▲ 1.0K

AI出了新活,能跟着你进度定制学习计划

有人做出了定制学习工具,AI能根据学习者的需求和进度,生成专属学习计划和学习中心

我对我们新的 /learn 功能着迷了。这是我学习和研究主题最喜欢的方式。

这个智能体可以生成学习计划和学习中心(构件),会根据学习者的需求和进度进行调整。

在 X 看原帖 ↗
1.0K143
观点 · @emollick▲ 10.7万

当前AI知识工具存在软件思维盲区 适配通用知识工作不足

分析现有Codex类AI工具适配全知识工作的核心问题

阅读全文 →
10.7万1491.6K859
企业战略 · @emollick▲ 3.1万

企业AI应用决策已成为组织战略设计而非IT选择

探讨企业应用AI时的核心决策属性与关键问题

在你的组织中如何使用 AI 的决策,正越来越多地成为组织设计和战略决策,而非 IT 选择:

你要如何将智能体整合进公司?你会把哪些智能工作外包?企业的边界在哪里?人的角色又是什么?

在 X 看原帖 ↗
3.1万25278162
开源 · @BrianRoemmele▲ 3.4K

无人工厂部署260个AI工人测试通义千问AgentWorld

无人工厂ZHC用260个AI工人在类生产场景测试Qwen-AgentWorld

阅读全文 →
3.4K3118
谷歌 · @omarsar0▲ 5.7K

开发者评价谷歌新推出的计算机操作模型产品

开发者分享对谷歌新款计算机操作模型的使用期待

这是 Google 推出的一个很酷的新版本。我现在在智能体循环/长时任务中已经非常依赖计算机使用功能。

我需要能力更强的计算机使用模型,同时还要保持低成本。我不确定 Gemini 3.5 Flash 的效率如何,但我很欣慰能有新的选择。

在 X 看原帖 ↗
5.7K23115
直播 · @altryne▲ 3.1万

主播明日将直播分享本周重要AI行业新闻

主播预告明日直播将讨论多个AI热点事件与新品

我很兴奋明天能回到演播室,报道过去一周最重要的AI新闻!

我们会聊到Fable被下架,它还会不会重新上线;@Zai_org 的GLM 5.2,以及我们拿到的两个全新视频模型;还有@midjourney 一项非常疯狂的硬件发布。

@dexhorthy 会加入我们,聊humanlayer的进化,以及如何摆脱“垃圾内容”;@vanpelt 和 @adrnswanberg 会给我们展示 @wandb 一款令人兴奋的新产品,名为hivemind!

明天上午8:30,就在这个X账号或者YouTube上收看我们(链接见下方)

来YouTube看我们的直播 👇

在 X 看原帖 ↗
3.1万1101

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

▲ Top
把任何一条丢给知识库,它基于全站内容给你带引用的回答。
✦ 去问知识库

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部