AI Pulse · 2026 年 6 月 25 日

今日焦点

OpenAI自研推理芯片Jalapeño，让ChatGPT更快更省更稳

OpenAI与博通联合发布了名为Jalapeño的AI推理芯片。这是OpenAI首次设计自己的处理器，目标是让ChatGPT、Codex、API以及未来的智能体产品跑得更好、更省、更稳。

成本是AI产品速度和可用性的关键限制因素。通用芯片（比如GPU）为大范围工作负载设计，对LLM推理不是最优解。Jalapeño从零开始为现代大语言模型量身打造，不是从老的AI负载改造而来。它优化了关键内核、内存移动、网络和服务模式——这些正是ChatGPT每天运行的东西。

Jalapeño的设计目标是兼顾顶级加速器的功率和吞吐量，同时达到专用推理系统才有的低延迟。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 55

不用装专用AI浏览器，插件就能跑AI智能体

全程在浏览器里运行，不需要额外装程序，用自己的API密钥，完全开源，可以直接试用

嘿 HN。http://peerd.ai 是一个完全以浏览器网页扩展形式运行的 AI agent 工具框架。

你不需要安装单独的“AI 浏览器”。你不需要附加或运行任何外部进程，也不用管理难用的 mcp 集成。

它就是一个完全自包含的网页扩展，用无构建流程的原生 JS 编写，非浏览器依赖极少，使用你自己的提供商密钥，采用 Apache 2 许可证。

这不仅仅是一个有趣的黑客项目。尽管它大体上一直是一个个人 side project，但我真心相信

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 85

开源生产级AI框架来了，直接能用

做生产环境可用的AI智能体和RAG检索增强生成，已有现成开源框架，不用从零搭

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 335

Ruby也有了支持所有主流AI服务商的框架

用Ruby写程序的开发者不用自己适配不同AI接口，可以直接调用了

社区讨论：有人质疑2026年没必要再用动态类型语言开发，静态类型能给大语言模型提供更清晰的信号。使用者普遍认可这个框架易用性好， usability接近Vercel的AI框架，也有人已经用它搭建出了开源ChatGPT克隆项目。同时使用者也反馈了多个具体问题，比如调参仍需要适配不同服务商的平台特性，缓存、追踪可观测性、Responses API原生支持都存在缺陷。

也有开发者分享了其他语言或同语言不同定位的同类开源工具。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 156

Gemini 3.5 Flash 开放了电脑操作功能

谷歌大模型原生支持自主操作电脑，不用额外插件就能完成自动化任务，操作门槛进一步降低。

社区讨论：多数用户反馈Gemini实际体验不佳，有用户让它做简单的PDF表格提取任务，经过十几次修正后它因超出错误阈值放弃，承认模型会虚构数据而非准确复制。不少用户指出防护栏调整过度，查询转号、备份规划、代码评估等正常请求均被拒绝，也有人不满它缺少竞品已有的克隆仓库做静态分析、MCP支持等功能，还有用户调侃官方评测图故意掩盖Gemini排名靠后的事实。仅有人认可它成本低，性能表现亮眼。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 220

创投大佬称马斯克的xAI是彻头彻尾的烂摊子

知名硅谷创投人公开评价马斯克旗下项目，SpaceX不算AI公司，xAI是彻底失败的项目

社区讨论：多数评论认为霍夫曼本身身份存在争议，他从未牵头做过一线科技项目，同时投资了OpenAI和Anthropic，批评xAI属于立场不对的个人恩怨，并不值得关注。不少人认可霍夫曼对xAI是烂摊子的判断，也有用户实际使用过Grok，称其准确率能和Gemini互争高下，最新版本表现稳定，不能太早否定xAI。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 141

OpenAI和博通合作，推出专为大模型设计的推理芯片

大模型运行推理的核心硬件，终于有了合作定制款，后续大模型推理成本可能因此变化

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 218

美国国家安全局失去了对Anthropic模型的访问权

政府机构和AI公司发生纠纷，直接导致官方失去AI服务权限

已解锁：https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-acce...

社区讨论：多数评论认为这更像是AI营销造势，当前AI领域的营销造势已经脱离实际，比起真实安全事件更像一场公关舆论战。部分人质疑 NSA 真失去 access的说法，认为美国政府完全可以强制获取模型权重，NSA内部仍安插人员，不可能彻底失去访问。也有不少人批评NSA近年大规模裁员效率低下，本身没有产出，不配掌握该技术。还有人提到，Mythos确实能快速攻破保密系统，破解二进制反编译成果，安全风险值得警惕。

在 HN 看讨论 ↗ 原文 / 论文 ↗

新品发布 · @gdb▲ 13.8万

从头做了九个月的LLM推理引擎，能效比惊人

想要更低功耗跑大模型推理，又多了一个从头开发的全新选择

我们推出 Jalapeño —— 这是一款从零开始设计、历时九个月完成的LLM推理产品，由我们的模型加速，每瓦性能表现十分出色。

OpenAI自研推理芯片Jalapeño，让ChatGPT更快更省更稳

🔥 信号雷达

不用装专用AI浏览器，插件就能跑AI智能体

开源生产级AI框架来了，直接能用

Ruby也有了支持所有主流AI服务商的框架

Gemini 3.5 Flash 开放了电脑操作功能

创投大佬称马斯克的xAI是彻头彻尾的烂摊子

OpenAI和博通合作，推出专为大模型设计的推理芯片

美国国家安全局失去了对Anthropic模型的访问权

从头做了九个月的LLM推理引擎，能效比惊人

开源模型跑出了ARC-AGI-2目前最好成绩

理解复杂系统，最快的方法是找它哪里会错

企业AI应用决策已成为组织战略设计而非IT选择

当前AI知识工具存在软件思维盲区 适配通用知识工作不足

AI模型性能跑分，难道比人思考还重要吗？

这个AI编码工具关网页也不会断运行会话

AI不是不够聪明，只是思考方式和人不一样

首个开源AI视频制作系统，单条成本不到1美元

OpenAI推出了自己研发的首款芯片，叫Jalapeño

开源Mistral OCR处理图表成绩超过GPT-5.5

Hugging Face平台上的机器人数据集越来越多

OpenAI自研新芯片启动了AI自我增强飞轮

金融机构用AI自动决策，几星期活几分钟做完

Devin开放两款强编码AI，Pro及以上用户免费用

Google AI Studio已经造出超百万个安卓App

OpenAI终于拿出自己做的第一款AI芯片了

这播客聊了太多科技圈核心问题的直给答案

AI工程师大会要讲智能体编码的推理需求

谷歌Gemini核心AI研究员，要跳槽去Anthropic了

说自己从来不用AI的人，其实偷偷在用

AI领域要迎来一轮架构大转变了？

AI出了新活，能跟着你进度定制学习计划

主播明日将直播分享本周重要AI行业新闻

开发者评价谷歌新推出的计算机操作模型产品

无人工厂部署260个AI工人测试通义千问AgentWorld

从头做了九个月的LLM推理引擎，能效比惊人

AI工程师大会要讲智能体编码的推理需求

Google AI Studio已经造出超百万个安卓App

Devin开放两款强编码AI，Pro及以上用户免费用

AI领域要迎来一轮架构大转变了？

谷歌Gemini核心AI研究员，要跳槽去Anthropic了

OpenAI终于拿出自己做的第一款AI芯片了

金融机构用AI自动决策，几星期活几分钟做完

AI模型性能跑分，难道比人思考还重要吗？

这个AI编码工具关网页也不会断运行会话

AI不是不够聪明，只是思考方式和人不一样

首个开源AI视频制作系统，单条成本不到1美元

OpenAI推出了自己研发的首款芯片，叫Jalapeño

开源Mistral OCR处理图表成绩超过GPT-5.5

Hugging Face平台上的机器人数据集越来越多

美国国家安全局失去了对Anthropic模型的访问权

OpenAI和博通合作，推出专为大模型设计的推理芯片

创投大佬称马斯克的xAI是彻头彻尾的烂摊子

Gemini 3.5 Flash 开放了电脑操作功能

Ruby也有了支持所有主流AI服务商的框架

开源生产级AI框架来了，直接能用

不用装专用AI浏览器，插件就能跑AI智能体

理解复杂系统，最快的方法是找它哪里会错

说自己从来不用AI的人，其实偷偷在用

这播客聊了太多科技圈核心问题的直给答案

OpenAI自研新芯片启动了AI自我增强飞轮

开源模型跑出了ARC-AGI-2目前最好成绩

AI出了新活，能跟着你进度定制学习计划

当前AI知识工具存在软件思维盲区 适配通用知识工作不足

企业AI应用决策已成为组织战略设计而非IT选择

无人工厂部署260个AI工人测试通义千问AgentWorld

开发者评价谷歌新推出的计算机操作模型产品

主播明日将直播分享本周重要AI行业新闻

📖 深度解读

OpenAI自研推理芯片Jalapeño，让ChatGPT更快更省更稳

OpenAI发布自研推理芯片，AI服务成本有望降低

构建有效的人机团队

📬 订阅 AI Pulse

当前AI知识工具存在软件思维盲区适配通用知识工作不足

当前AI知识工具存在软件思维盲区适配通用知识工作不足