嘿 HN。http://peerd.ai 是一个完全以浏览器网页扩展形式运行的 AI agent 工具框架。
你不需要安装单独的“AI 浏览器”。你不需要附加或运行任何外部进程,也不用管理难用的 mcp 集成。
它就是一个完全自包含的网页扩展,用无构建流程的原生 JS 编写,非浏览器依赖极少,使用你自己的提供商密钥,采用 Apache 2 许可证。
这不仅仅是一个有趣的黑客项目。尽管它大体上一直是一个个人 side project,但我真心相信
OpenAI与博通联合发布了名为Jalapeño的AI推理芯片。这是OpenAI首次设计自己的处理器,目标是让ChatGPT、Codex、API以及未来的智能体产品跑得更好、更省、更稳。
成本是AI产品速度和可用性的关键限制因素。通用芯片(比如GPU)为大范围工作负载设计,对LLM推理不是最优解。Jalapeño从零开始为现代大语言模型量身打造,不是从老的AI负载改造而来。它优化了关键内核、内存移动、网络和服务模式——这些正是ChatGPT每天运行的东西。
Jalapeño的设计目标是兼顾顶级加速器的功率和吞吐量,同时达到专用推理系统才有的低延迟。
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌
全程在浏览器里运行,不需要额外装程序,用自己的API密钥,完全开源,可以直接试用
嘿 HN。http://peerd.ai 是一个完全以浏览器网页扩展形式运行的 AI agent 工具框架。
你不需要安装单独的“AI 浏览器”。你不需要附加或运行任何外部进程,也不用管理难用的 mcp 集成。
它就是一个完全自包含的网页扩展,用无构建流程的原生 JS 编写,非浏览器依赖极少,使用你自己的提供商密钥,采用 Apache 2 许可证。
这不仅仅是一个有趣的黑客项目。尽管它大体上一直是一个个人 side project,但我真心相信
做生产环境可用的AI智能体和RAG检索增强生成,已有现成开源框架,不用从零搭
用Ruby写程序的开发者不用自己适配不同AI接口,可以直接调用了
社区讨论:有人质疑2026年没必要再用动态类型语言开发,静态类型能给大语言模型提供更清晰的信号。使用者普遍认可这个框架易用性好, usability接近Vercel的AI框架,也有人已经用它搭建出了开源ChatGPT克隆项目。同时使用者也反馈了多个具体问题,比如调参仍需要适配不同服务商的平台特性,缓存、追踪可观测性、Responses API原生支持都存在缺陷。
也有开发者分享了其他语言或同语言不同定位的同类开源工具。
谷歌大模型原生支持自主操作电脑,不用额外插件就能完成自动化任务,操作门槛进一步降低。
社区讨论:多数用户反馈Gemini实际体验不佳,有用户让它做简单的PDF表格提取任务,经过十几次修正后它因超出错误阈值放弃,承认模型会虚构数据而非准确复制。不少用户指出防护栏调整过度,查询转号、备份规划、代码评估等正常请求均被拒绝,也有人不满它缺少竞品已有的克隆仓库做静态分析、MCP支持等功能,还有用户调侃官方评测图故意掩盖Gemini排名靠后的事实。仅有人认可它成本低,性能表现亮眼。
知名硅谷创投人公开评价马斯克旗下项目,SpaceX不算AI公司,xAI是彻底失败的项目
社区讨论:多数评论认为霍夫曼本身身份存在争议,他从未牵头做过一线科技项目,同时投资了OpenAI和Anthropic,批评xAI属于立场不对的个人恩怨,并不值得关注。不少人认可霍夫曼对xAI是烂摊子的判断,也有用户实际使用过Grok,称其准确率能和Gemini互争高下,最新版本表现稳定,不能太早否定xAI。
大模型运行推理的核心硬件,终于有了合作定制款,后续大模型推理成本可能因此变化
政府机构和AI公司发生纠纷,直接导致官方失去AI服务权限
已解锁:https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-acce...
社区讨论:多数评论认为这更像是AI营销造势,当前AI领域的营销造势已经脱离实际,比起真实安全事件更像一场公关舆论战。部分人质疑 NSA 真失去 access的说法,认为美国政府完全可以强制获取模型权重,NSA内部仍安插人员,不可能彻底失去访问。也有不少人批评NSA近年大规模裁员效率低下,本身没有产出,不配掌握该技术。还有人提到,Mythos确实能快速攻破保密系统,破解二进制反编译成果,安全风险值得警惕。
想要更低功耗跑大模型推理,又多了一个从头开发的全新选择
这是目前开源模型在ARC-AGI-2上拿到的最优表现
研究复杂系统时,边界案例和失效模式能帮你画出系统的完整轮廓,直接抓到系统的核心边界
探讨企业应用AI时的核心决策属性与关键问题
在你的组织中如何使用 AI 的决策,正越来越多地成为组织设计和战略决策,而非 IT 选择:
你要如何将智能体整合进公司?你会把哪些智能工作外包?企业的边界在哪里?人的角色又是什么?
分析现有Codex类AI工具适配全知识工作的核心问题
有人质疑行业一直在快速迭代更新AI模型,却总引导大家用AI替代思考,没说清模型到底聪明在哪。
Pi Coding Agent把AI编码会话放在服务器后台跑,关网页、重启前端都不影响,还能跨设备查看进度。
Pi Coding Agent 的 Web UI 在浏览器里持久化运行、跨设备监督 AI 编码 Agent 的桌面/服务器应用。 核心思路是 Agent 会话在服务器端跑,跟浏览器断开没关系,就算你关了网页、重启了前端服务,会话还在。用了双进程架构,会话守护进程跟 Web 服务分开,前者管 Agent 的运行时,后者只管 API 和 UI 展示。
有观点提出,AI的认知逻辑和人类的认知逻辑属于完全不同的体系,不能用人类的标准评判它的智力。
OpenMontage可以把Claude或Cursor变成完整的AI视频工作室,所有代码和工具都是开源的。
科技博主爆料,这是OpenAI自研的第一块AI芯片,目前仅公布了名称。
研究人员利用图表标注功能更新了模型效果,总分仅落后于Gemini 3.1 Pro。
我们公布了 Mistral OCR 的最新测评结果,结果中用到了针对图表的标注功能。
它的总分领先 GPT-5.5,仅落后于 Gemini 3.1 Pro,以它这个价位区间的模型来说,表现相当出色。
它在内容忠实度、语义格式和视觉定位方面都做得很好。它处理表格的表现尚可,处理图表的表现也尚可——不过说句公道话,得分不为零已经不错了。
近期视觉理解能力领域已经取得了不少出色的进展。性能表现见下方截图,我们很快会更新主基准测试页面。
社区正在持续上传大规模机器人相关数据集,训练机器人AI的公开素材变多了。
现在OpenAI的模型已经开始帮忙造更好的硬件,更好的硬件能训练更强的模型,更强的模型又能优化下一代芯片,这就是自我增强循环。
OpenAI的新芯片可能才是RSI飞轮启动的地方,不是那种模型一夜之间自我改写的科幻版本——但现在OpenAI的模型会帮助打造更好的硬件,更好的硬件能造出更强的模型,更强的模型又会改进下一代芯片,这就是RSI循环。
拿到1.1亿美元融资的AI公司,正在用AI智能体帮金融机构搞定耗时耗钱的人工流程
恭喜@taktile_org完成1.1亿美元C轮融资!
银行和保险公司每年要花费数十亿美元筛查风险交易、处理理赔以及客户开户。
Taktile用AI agents自动化这些决策流程,把原本需要数周完成的流程压缩到几分钟。
现有Pro/Max/Teams权限的用户,可以直接在Devin命令行和桌面端免费试用这两个新模型
两款实力顶尖的全新代码模型现已可以在 Devin 中免费试用。
Kimi K2.7 Code 和 GLM 5.2 已上线 Devin CLI 和 Devin Desktop,供 Pro/Max/Teams 用户免费使用。
2026年5月才宣布原生安卓应用构建功能,现在已经生成超过一百万个应用。
2026年5月:我们宣布在 AI Studio 推出原生 Android 应用构建功能。
今日:已有超过100万个 Android 应用通过 AI Studio 创建。
立即构建你的第一个 Android 应用:
(注:这还不是一座真正的雕像……目前)
OpenAI公开了自研的第一款AI处理器,叫Jalapeño
里面有Databricks赢Snowflake的直接原因,大模型代理云竞争里哪项能力最重要,还有千亿美元大厂怎么保留创业文化
这期播客有超多干货爆料:
- Databricks 为什么击败了 Snowflake(真的给了直截了当的回答!)
- 为什么现在所有人都在做元 harness
为什么 @neondatabase 的存在如此合理(@nikitabase 吹了它太多,都吹得有点离谱了)
LTAP 如何实现我之前和 @ankrgyl 在 @braintrust 播客里聊过的 HTAP 理想
@MosaicML 和 DBRX 到底发生了什么
如何在一家市值 1750 亿美元的大公司里保持研究创业文化
在通往智能体云的竞赛中,哪项知识/经验更重要:数据库、操作系统,还是……网络!
我非常荣幸能受邀参加 @Data_AI_Summit,采访行业里两位顶尖人物,还能和他们畅聊各种话题,从 @bennstancil 的现代数据栈主题,到 @alighodsi 精彩主旨演讲的强大气场。
准备上线AI智能体编码服务的从业者,可以现场学习推理引擎如何适配生产级智能体工作负载
智能体编码改变了推理引擎需要处理的内容。
在 AI Engineer World's Fair,Together AI 工程师将主持一场实操研讨会,主题是推理引擎的工作原理,以及承载生产级智能体负载需要哪些条件。
活动时间:6月29日第一天,上午9点至11点。地点:2020会议室。
两名被谷歌内部视作Gemini核心贡献者的AI研究员,计划从谷歌离职加入Anthropic
消息来源:Bloomberg 报道,Google AI 研究员 Jonas Adler 与 Alexander Pritzel 二人在内部均被视为 Gemini 的核心贡献者,他们正计划离职加入 Anthropic。
如需链接和完整上下文,请访问 Techmeme dot com!
不少声称不用AI的人,实际正在偷偷使用AI
两款产品已经引发关于AI依赖与韧性的严肃讨论,合作方认为这只是AI开发架构转变的开始。
我很开心能和@OpenRouter达成合作 ⚡
OpenRouter Fusion和Sakana Fugu这类产品已经引发了关于AI领域依赖性与韧性的重要讨论。
我相信,这只是AI开发即将到来的大规模架构转型的开端。
有人做出了定制学习工具,AI能根据学习者的需求和进度,生成专属学习计划和学习中心
主播预告明日直播将讨论多个AI热点事件与新品
我很兴奋明天能回到演播室,报道过去一周最重要的AI新闻!
我们会聊到Fable被下架,它还会不会重新上线;@Zai_org 的GLM 5.2,以及我们拿到的两个全新视频模型;还有@midjourney 一项非常疯狂的硬件发布。
@dexhorthy 会加入我们,聊humanlayer的进化,以及如何摆脱“垃圾内容”;@vanpelt 和 @adrnswanberg 会给我们展示 @wandb 一款令人兴奋的新产品,名为hivemind!
明天上午8:30,就在这个X账号或者YouTube上收看我们(链接见下方)
来YouTube看我们的直播 👇
开发者分享对谷歌新款计算机操作模型的使用期待
这是 Google 推出的一个很酷的新版本。我现在在智能体循环/长时任务中已经非常依赖计算机使用功能。
我需要能力更强的计算机使用模型,同时还要保持低成本。我不确定 Gemini 3.5 Flash 的效率如何,但我很欣慰能有新的选择。
无人工厂ZHC用260个AI工人在类生产场景测试Qwen-AgentWorld
想要更低功耗跑大模型推理,又多了一个从头开发的全新选择
准备上线AI智能体编码服务的从业者,可以现场学习推理引擎如何适配生产级智能体工作负载
智能体编码改变了推理引擎需要处理的内容。
在 AI Engineer World's Fair,Together AI 工程师将主持一场实操研讨会,主题是推理引擎的工作原理,以及承载生产级智能体负载需要哪些条件。
活动时间:6月29日第一天,上午9点至11点。地点:2020会议室。
2026年5月才宣布原生安卓应用构建功能,现在已经生成超过一百万个应用。
2026年5月:我们宣布在 AI Studio 推出原生 Android 应用构建功能。
今日:已有超过100万个 Android 应用通过 AI Studio 创建。
立即构建你的第一个 Android 应用:
(注:这还不是一座真正的雕像……目前)
现有Pro/Max/Teams权限的用户,可以直接在Devin命令行和桌面端免费试用这两个新模型
两款实力顶尖的全新代码模型现已可以在 Devin 中免费试用。
Kimi K2.7 Code 和 GLM 5.2 已上线 Devin CLI 和 Devin Desktop,供 Pro/Max/Teams 用户免费使用。
两款产品已经引发关于AI依赖与韧性的严肃讨论,合作方认为这只是AI开发架构转变的开始。
我很开心能和@OpenRouter达成合作 ⚡
OpenRouter Fusion和Sakana Fugu这类产品已经引发了关于AI领域依赖性与韧性的重要讨论。
我相信,这只是AI开发即将到来的大规模架构转型的开端。
两名被谷歌内部视作Gemini核心贡献者的AI研究员,计划从谷歌离职加入Anthropic
消息来源:Bloomberg 报道,Google AI 研究员 Jonas Adler 与 Alexander Pritzel 二人在内部均被视为 Gemini 的核心贡献者,他们正计划离职加入 Anthropic。
如需链接和完整上下文,请访问 Techmeme dot com!
OpenAI公开了自研的第一款AI处理器,叫Jalapeño
拿到1.1亿美元融资的AI公司,正在用AI智能体帮金融机构搞定耗时耗钱的人工流程
恭喜@taktile_org完成1.1亿美元C轮融资!
银行和保险公司每年要花费数十亿美元筛查风险交易、处理理赔以及客户开户。
Taktile用AI agents自动化这些决策流程,把原本需要数周完成的流程压缩到几分钟。
有人质疑行业一直在快速迭代更新AI模型,却总引导大家用AI替代思考,没说清模型到底聪明在哪。
Pi Coding Agent把AI编码会话放在服务器后台跑,关网页、重启前端都不影响,还能跨设备查看进度。
Pi Coding Agent 的 Web UI 在浏览器里持久化运行、跨设备监督 AI 编码 Agent 的桌面/服务器应用。 核心思路是 Agent 会话在服务器端跑,跟浏览器断开没关系,就算你关了网页、重启了前端服务,会话还在。用了双进程架构,会话守护进程跟 Web 服务分开,前者管 Agent 的运行时,后者只管 API 和 UI 展示。
有观点提出,AI的认知逻辑和人类的认知逻辑属于完全不同的体系,不能用人类的标准评判它的智力。
OpenMontage可以把Claude或Cursor变成完整的AI视频工作室,所有代码和工具都是开源的。
科技博主爆料,这是OpenAI自研的第一块AI芯片,目前仅公布了名称。
研究人员利用图表标注功能更新了模型效果,总分仅落后于Gemini 3.1 Pro。
我们公布了 Mistral OCR 的最新测评结果,结果中用到了针对图表的标注功能。
它的总分领先 GPT-5.5,仅落后于 Gemini 3.1 Pro,以它这个价位区间的模型来说,表现相当出色。
它在内容忠实度、语义格式和视觉定位方面都做得很好。它处理表格的表现尚可,处理图表的表现也尚可——不过说句公道话,得分不为零已经不错了。
近期视觉理解能力领域已经取得了不少出色的进展。性能表现见下方截图,我们很快会更新主基准测试页面。
社区正在持续上传大规模机器人相关数据集,训练机器人AI的公开素材变多了。
政府机构和AI公司发生纠纷,直接导致官方失去AI服务权限
已解锁:https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-acce...
社区讨论:多数评论认为这更像是AI营销造势,当前AI领域的营销造势已经脱离实际,比起真实安全事件更像一场公关舆论战。部分人质疑 NSA 真失去 access的说法,认为美国政府完全可以强制获取模型权重,NSA内部仍安插人员,不可能彻底失去访问。也有不少人批评NSA近年大规模裁员效率低下,本身没有产出,不配掌握该技术。还有人提到,Mythos确实能快速攻破保密系统,破解二进制反编译成果,安全风险值得警惕。
大模型运行推理的核心硬件,终于有了合作定制款,后续大模型推理成本可能因此变化
知名硅谷创投人公开评价马斯克旗下项目,SpaceX不算AI公司,xAI是彻底失败的项目
社区讨论:多数评论认为霍夫曼本身身份存在争议,他从未牵头做过一线科技项目,同时投资了OpenAI和Anthropic,批评xAI属于立场不对的个人恩怨,并不值得关注。不少人认可霍夫曼对xAI是烂摊子的判断,也有用户实际使用过Grok,称其准确率能和Gemini互争高下,最新版本表现稳定,不能太早否定xAI。
谷歌大模型原生支持自主操作电脑,不用额外插件就能完成自动化任务,操作门槛进一步降低。
社区讨论:多数用户反馈Gemini实际体验不佳,有用户让它做简单的PDF表格提取任务,经过十几次修正后它因超出错误阈值放弃,承认模型会虚构数据而非准确复制。不少用户指出防护栏调整过度,查询转号、备份规划、代码评估等正常请求均被拒绝,也有人不满它缺少竞品已有的克隆仓库做静态分析、MCP支持等功能,还有用户调侃官方评测图故意掩盖Gemini排名靠后的事实。仅有人认可它成本低,性能表现亮眼。
用Ruby写程序的开发者不用自己适配不同AI接口,可以直接调用了
社区讨论:有人质疑2026年没必要再用动态类型语言开发,静态类型能给大语言模型提供更清晰的信号。使用者普遍认可这个框架易用性好, usability接近Vercel的AI框架,也有人已经用它搭建出了开源ChatGPT克隆项目。同时使用者也反馈了多个具体问题,比如调参仍需要适配不同服务商的平台特性,缓存、追踪可观测性、Responses API原生支持都存在缺陷。
也有开发者分享了其他语言或同语言不同定位的同类开源工具。
做生产环境可用的AI智能体和RAG检索增强生成,已有现成开源框架,不用从零搭
全程在浏览器里运行,不需要额外装程序,用自己的API密钥,完全开源,可以直接试用
嘿 HN。http://peerd.ai 是一个完全以浏览器网页扩展形式运行的 AI agent 工具框架。
你不需要安装单独的“AI 浏览器”。你不需要附加或运行任何外部进程,也不用管理难用的 mcp 集成。
它就是一个完全自包含的网页扩展,用无构建流程的原生 JS 编写,非浏览器依赖极少,使用你自己的提供商密钥,采用 Apache 2 许可证。
这不仅仅是一个有趣的黑客项目。尽管它大体上一直是一个个人 side project,但我真心相信
研究复杂系统时,边界案例和失效模式能帮你画出系统的完整轮廓,直接抓到系统的核心边界
不少声称不用AI的人,实际正在偷偷使用AI
里面有Databricks赢Snowflake的直接原因,大模型代理云竞争里哪项能力最重要,还有千亿美元大厂怎么保留创业文化
这期播客有超多干货爆料:
- Databricks 为什么击败了 Snowflake(真的给了直截了当的回答!)
- 为什么现在所有人都在做元 harness
为什么 @neondatabase 的存在如此合理(@nikitabase 吹了它太多,都吹得有点离谱了)
LTAP 如何实现我之前和 @ankrgyl 在 @braintrust 播客里聊过的 HTAP 理想
@MosaicML 和 DBRX 到底发生了什么
如何在一家市值 1750 亿美元的大公司里保持研究创业文化
在通往智能体云的竞赛中,哪项知识/经验更重要:数据库、操作系统,还是……网络!
我非常荣幸能受邀参加 @Data_AI_Summit,采访行业里两位顶尖人物,还能和他们畅聊各种话题,从 @bennstancil 的现代数据栈主题,到 @alighodsi 精彩主旨演讲的强大气场。
现在OpenAI的模型已经开始帮忙造更好的硬件,更好的硬件能训练更强的模型,更强的模型又能优化下一代芯片,这就是自我增强循环。
OpenAI的新芯片可能才是RSI飞轮启动的地方,不是那种模型一夜之间自我改写的科幻版本——但现在OpenAI的模型会帮助打造更好的硬件,更好的硬件能造出更强的模型,更强的模型又会改进下一代芯片,这就是RSI循环。
这是目前开源模型在ARC-AGI-2上拿到的最优表现
有人做出了定制学习工具,AI能根据学习者的需求和进度,生成专属学习计划和学习中心
分析现有Codex类AI工具适配全知识工作的核心问题
探讨企业应用AI时的核心决策属性与关键问题
在你的组织中如何使用 AI 的决策,正越来越多地成为组织设计和战略决策,而非 IT 选择:
你要如何将智能体整合进公司?你会把哪些智能工作外包?企业的边界在哪里?人的角色又是什么?
无人工厂ZHC用260个AI工人在类生产场景测试Qwen-AgentWorld
开发者分享对谷歌新款计算机操作模型的使用期待
这是 Google 推出的一个很酷的新版本。我现在在智能体循环/长时任务中已经非常依赖计算机使用功能。
我需要能力更强的计算机使用模型,同时还要保持低成本。我不确定 Gemini 3.5 Flash 的效率如何,但我很欣慰能有新的选择。
主播预告明日直播将讨论多个AI热点事件与新品
我很兴奋明天能回到演播室,报道过去一周最重要的AI新闻!
我们会聊到Fable被下架,它还会不会重新上线;@Zai_org 的GLM 5.2,以及我们拿到的两个全新视频模型;还有@midjourney 一项非常疯狂的硬件发布。
@dexhorthy 会加入我们,聊humanlayer的进化,以及如何摆脱“垃圾内容”;@vanpelt 和 @adrnswanberg 会给我们展示 @wandb 一款令人兴奋的新产品,名为hivemind!
明天上午8:30,就在这个X账号或者YouTube上收看我们(链接见下方)
来YouTube看我们的直播 👇
精选文章的中文编辑重写 · 按更新时间排列
每天三次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30、15:00 和 19:30 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00、14:30 和 19:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。