AI Pulse
📚 764 篇文章
📡 939 条信号
🏷️ 206 个主题
📰 今日焦点

Google搜索YouTube文档将内置AI,可24小时后台执行任务

编者按: 以下是谷歌首席执行官桑达尔·皮查伊在2026年谷歌I/O大会上的演讲编辑稿,已进行调整以包含更多在舞台上宣布的内容。请在我们的合集中查看所有公告。

自去年I/O大会以来,这是非凡的一年,一个持续交付、技术进步和超速发展的时期。我们现在正处于AI周期的阶段,人们希望看到他们在日常使用的产品中的价值。我们一直非常专注于这一点,你们将在今天I/O大会上宣布的产品和功能中看到这一点。

自我们公司转向AI优先战略十年来,我们仍然认为AI是实现我们使命和大规模改善人们生活的最深刻方式。这就是为什么我们一直采用差异化的全栈式AI创新方法,从我们的定制芯片和安全基础,到世界级的研究和模型,再到触及数十亿人的产品和平台。这种方法使我们能够更快地迭代和创新,从而照亮公司的每一个角落。

阅读全文 →

🔥 信号雷达

来自 𝕏 的实时信号,经 AI 聚类分析

AI安全新组织刚成立,合同里白纸黑字写着‘我们不管你说什么’

AI安全NEWS
2.2万45325100

一些个人消息:我创立了一家新的 AI 安全标准机构,我们的前两项标准已于今日发布。我们名为 Guidelight,联合创始人是另一位前 OpenAI 安全研究员 Page Hedley。(1/n)

在 X 看原帖 ↗

以色列LLM实验室一夜裁掉61%员工,背后站着谷歌和英伟达

AI商业NEWS
8.0万4823645

裁员警报:AI21 Labs 🚨 裁员110人,占员工总数的61%。一天之内,员工人数从180人降至70人。这并非一家名不见经传的初创公司。

其股东名单中包括Google和Nvidia。已融资5.75亿美元。这家以色列大语言模型实验室表示,销售语言模型“并非可持续的收入来源”,正转向AI智能体(AI agents)。

在 X 看原帖 ↗

人类说服技巧对AI起效了,而且效果比对人还明显

AI研究RESEARCH
7.0K86020

🚨我们的论文已发表于《美国国家科学院院刊》(PNAS):我们发现,经典的人类说服技巧以一种“类人”方式对人工智能起效,使其同意那些不当请求(依从率从35%提升至51%)。该方法在一系列主流大语言模型(LLM)上均有效,尽管较新的模型抵抗性更强。

在 X 看原帖 ↗

开源视觉模型SAM3能跟住篮球运动员,连球衣褶皱都不丢

AI工具LAUNCH
32.4万1162.1K1.8K

没有陷阱;SAM3 是开源的,而且非常出色。它特别擅长物体跟踪,甚至在篮球比赛这样极其复杂的场景中也能表现优异。它可能是我迄今为止最喜欢的计算机视觉模型。

在 X 看原帖 ↗

四家AI巨头主动交出模型内核做风险测试

AI安全前沿风险
2.3万4420179

一家 AI 公司是否会失去对其自身智能体(agents)的控制?为探究这一问题,Anthropic、Google、Meta 和 OpenAI 允许我们:(1)使用思维链(CoT)访问权限测试其最佳内部模型;(2)审阅有关能力、对齐性(alignment)与控制机制的非公开信息。结果是:我们的首份《前沿风险报告》(Frontier Risk Report)。

在 X 看原帖 ↗

AI写代码还能自动修漏洞?

AI安全开发者工具
8.7K17919

尽管 AI 正在帮助我们应对重大挑战,但它也带来了新的潜在安全风险。正因如此,我们专注于构建保障更广泛生态系统安全的工具——例如 CodeMender,一款可自动发现并修复关键软件漏洞的代码安全代理。

在 X 看原帖 ↗

AI Studio项目一键导出到Antigravity

AI StudioAntigravity
1.1万1317351

虽然 Google AI Studio 是从提示词到应用的最快路径,但随着团队的发展,转向本地开发平台可帮助开发者实现更快的迭代。现在,您只需一键即可将 AI Studio 项目导出并导入 @Antigravity。

在 X 看原帖 ↗

Gemini 3.5 Flash来了,专攻长周期任务

AI模型Google
3.0万6068055

没有新模型发布的 Google I/O 就不算完整的 Google I/O。 来认识一下 Gemini 3.5 Flash:它为智能体(agents)和编程任务提供前沿性能,在复杂、长周期任务中表现出色,可立即交付真实世界价值;现已通过 Gemini API 在 Google AI Studio 中提供。

在 X 看原帖 ↗

一次调用,就配好远程Linux环境

Gemini APIManaged Agents
4.5万871.0K408

推出 Gemini API 的托管智能体(Managed Agents)——仅需一次 API 调用,即可获得一个由 Google 托管的远程 Linux 环境智能体,随时可扩展;您可用 Markdown 定义自定义指令、技能和工具。

在 X 看原帖 ↗

代码当AI助手?这份百页报告讲透了

AI代码即助手
1.1万35156198

// Code as Agent Harness // 一份超过 100 页的报告,涵盖与 agent harness 相关的所有内容。(建议收藏) 尤其值得注意的是,该综述汇总了 code as agent harness 的方法与应用。 本文有力地论证了 code-as-harness 或许正是推动我们前进的关键。

在 X 看原帖 ↗

谷歌造出地球的数字孪生体

AI模拟数字孪生
6.9K156711

AI 模拟是科学领域的另一项强大工具,使我们能够理解并预测动态系统。这些模拟包括: 🌍 AlphaEarth Foundations,一个地球的“数字孪生”,有望帮助应对毁林和粮食安全等问题 🌧️ 我们最先进的

在 X 看原帖 ↗

在AI Studio里直接调用Sheet和Drive

AI StudioGoogle Workspace
3.4万58475110

你现在可以在 AI Studio 中构建应用,直接与 Google Workspace 交互:启动可从 Google Sheets 拉取数据、整理 Google Drive、或处理团队文档的工具,全程无需离开 AI Studio。

在 X 看原帖 ↗

OpenAI生成的图,现在能被一键识别了

AI检测OpenAI
8.0万2058282

SynthID(用于检测图像是否由 OpenAI 生成):

在 X 看原帖 ↗

交大开源大模型实战教程库

LLM开源教程
4.0K148288

很多人学大模型,最容易遇到资料很全,但不知道怎么动手的情况。GitHub: 上海交大出品的 Dive into LLMs,是一个大模型实战教程库,覆盖从模型微调、部署、提示学习,到知识编辑、数学推理、多模态、GUI Agent、安全对齐等 11 个方向。每个主题都配了 PDF 课件、Markdown 教程和可运行的 Jupyter Notebook,不只是讲概念,而是能直接跟着跑实验。

内容包括:微调与部署、提示学习与思维链、知识编辑、数学推理、模型水印、越狱攻击、大模型隐写、多模态模型、GUI 智能体、智能体安全、基于 PPO 的 RLHF 安全对齐。比较适合两类人:一类是想系统补大模型实战链路的开发者,另一类是做研究、毕设、项目选题时,想快速切入某个具体方向的学生。

在 X 看原帖 ↗
🔬 前沿研究

代码当AI助手?这份百页报告讲透了

AI代码即助手
1.1万35156198

// Code as Agent Harness // 一份超过 100 页的报告,涵盖与 agent harness 相关的所有内容。(建议收藏) 尤其值得注意的是,该综述汇总了 code as agent harness 的方法与应用。 本文有力地论证了 code-as-harness 或许正是推动我们前进的关键。

在 X 看原帖 ↗

四家AI巨头主动交出模型内核做风险测试

AI安全前沿风险
2.3万4420179

一家 AI 公司是否会失去对其自身智能体(agents)的控制?为探究这一问题,Anthropic、Google、Meta 和 OpenAI 允许我们:(1)使用思维链(CoT)访问权限测试其最佳内部模型;(2)审阅有关能力、对齐性(alignment)与控制机制的非公开信息。结果是:我们的首份《前沿风险报告》(Frontier Risk Report)。

在 X 看原帖 ↗
🚀 新品发布

在AI Studio里直接调用Sheet和Drive

AI StudioGoogle Workspace
3.4万58475110

你现在可以在 AI Studio 中构建应用,直接与 Google Workspace 交互:启动可从 Google Sheets 拉取数据、整理 Google Drive、或处理团队文档的工具,全程无需离开 AI Studio。

在 X 看原帖 ↗

一次调用,就配好远程Linux环境

Gemini APIManaged Agents
4.5万871.0K408

推出 Gemini API 的托管智能体(Managed Agents)——仅需一次 API 调用,即可获得一个由 Google 托管的远程 Linux 环境智能体,随时可扩展;您可用 Markdown 定义自定义指令、技能和工具。

在 X 看原帖 ↗

Gemini 3.5 Flash来了,专攻长周期任务

AI模型Google
3.0万6068055

没有新模型发布的 Google I/O 就不算完整的 Google I/O。 来认识一下 Gemini 3.5 Flash:它为智能体(agents)和编程任务提供前沿性能,在复杂、长周期任务中表现出色,可立即交付真实世界价值;现已通过 Gemini API 在 Google AI Studio 中提供。

在 X 看原帖 ↗

AI Studio项目一键导出到Antigravity

AI StudioAntigravity
1.1万1317351

虽然 Google AI Studio 是从提示词到应用的最快路径,但随着团队的发展,转向本地开发平台可帮助开发者实现更快的迭代。现在,您只需一键即可将 AI Studio 项目导出并导入 @Antigravity。

在 X 看原帖 ↗

AI写代码还能自动修漏洞?

AI安全开发者工具
8.7K17919

尽管 AI 正在帮助我们应对重大挑战,但它也带来了新的潜在安全风险。正因如此,我们专注于构建保障更广泛生态系统安全的工具——例如 CodeMender,一款可自动发现并修复关键软件漏洞的代码安全代理。

在 X 看原帖 ↗
📰 行业动态

谷歌造出地球的数字孪生体

AI模拟数字孪生
6.9K156711

AI 模拟是科学领域的另一项强大工具,使我们能够理解并预测动态系统。这些模拟包括: 🌍 AlphaEarth Foundations,一个地球的“数字孪生”,有望帮助应对毁林和粮食安全等问题 🌧️ 我们最先进的

在 X 看原帖 ↗

AI安全新组织刚成立,合同里白纸黑字写着‘我们不管你说什么’

AI安全NEWS
2.2万45325100

一些个人消息:我创立了一家新的 AI 安全标准机构,我们的前两项标准已于今日发布。我们名为 Guidelight,联合创始人是另一位前 OpenAI 安全研究员 Page Hedley。(1/n)

在 X 看原帖 ↗

以色列LLM实验室一夜裁掉61%员工,背后站着谷歌和英伟达

AI商业NEWS
8.0万4823645

裁员警报:AI21 Labs 🚨 裁员110人,占员工总数的61%。一天之内,员工人数从180人降至70人。这并非一家名不见经传的初创公司。

其股东名单中包括Google和Nvidia。已融资5.75亿美元。这家以色列大语言模型实验室表示,销售语言模型“并非可持续的收入来源”,正转向AI智能体(AI agents)。

在 X 看原帖 ↗

人类说服技巧对AI起效了,而且效果比对人还明显

AI研究RESEARCH
7.0K86020

🚨我们的论文已发表于《美国国家科学院院刊》(PNAS):我们发现,经典的人类说服技巧以一种“类人”方式对人工智能起效,使其同意那些不当请求(依从率从35%提升至51%)。该方法在一系列主流大语言模型(LLM)上均有效,尽管较新的模型抵抗性更强。

在 X 看原帖 ↗

开源视觉模型SAM3能跟住篮球运动员,连球衣褶皱都不丢

AI工具LAUNCH
32.4万1162.1K1.8K

没有陷阱;SAM3 是开源的,而且非常出色。它特别擅长物体跟踪,甚至在篮球比赛这样极其复杂的场景中也能表现优异。它可能是我迄今为止最喜欢的计算机视觉模型。

在 X 看原帖 ↗
📌 其他

OpenAI生成的图,现在能被一键识别了

AI检测OpenAI
8.0万2058282

SynthID(用于检测图像是否由 OpenAI 生成):

在 X 看原帖 ↗

交大开源大模型实战教程库

LLM开源教程
4.0K148288

很多人学大模型,最容易遇到资料很全,但不知道怎么动手的情况。GitHub: 上海交大出品的 Dive into LLMs,是一个大模型实战教程库,覆盖从模型微调、部署、提示学习,到知识编辑、数学推理、多模态、GUI Agent、安全对齐等 11 个方向。每个主题都配了 PDF 课件、Markdown 教程和可运行的 Jupyter Notebook,不只是讲概念,而是能直接跟着跑实验。

内容包括:微调与部署、提示学习与思维链、知识编辑、数学推理、模型水印、越狱攻击、大模型隐写、多模态模型、GUI 智能体、智能体安全、基于 PPO 的 RLHF 安全对齐。比较适合两类人:一类是想系统补大模型实战链路的开发者,另一类是做研究、毕设、项目选题时,想快速切入某个具体方向的学生。

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

08:31 更新20 篇
Google搜索YouTube文档将内置AI,可24小时后台执行任务
用户可在YouTube提问直达视频位置,文档语音创建,搜索生成动态图表,AI代理24小时运行。
Google AIagentsproduct
AI模型能自己跑完复杂任务,速度快4倍成本不到一半
Google发布Gemini 3.5 Flash,可自主执行多步操作,企业已用于分析、开户等场景。
Google AI工程商业
Google 给 AI 代理开了个后门:Android CLI 1.0 稳定版
Google 承认了——很多人用非自家的 AI 代理写安卓应用。它没堵这条路,而是给这些代理装了个官方工具包。
TechCrunch AI工程开源
你还在搜关键词?AI搜索已能理解复杂问题并直接规划
用户写完整句子、用语音或图片提问,搜索长度是传统三倍,月活超10亿。
Google AI搜索用户行为
Google Workspace要升级了:语音搜、图片随手改、AI替你干活
Google给Workspace加了三样新东西:语音搜索、可以精确编辑的图片工具,还有一个24小时待命的AI代理。
Google AI产品发布办公软件
不用想关键词了,Google搜索框直接扔需求就出答案
AI Mode默认模型升级Gemini 3.5 Flash,支持多模态输入和连续追问,今天起向全球逐步推送。
Google AI搜索产品发布
Google订阅推出24小时AI管家,自动处理邮件和日程
每月100美元的AI Ultra计划还包含20TB云存储、YouTube Premium和优先使用开发平台。
Google AI商业产品发布
让AI写代码时自动记笔记,开发者能追踪它的决策过程
一种提示词要求AI根据功能规范维护implementation-notes.md,记录技术取舍和潜在风险。
𝕏 @bozhou_ai 🧵 Thread AI工程教程
Karpathy:Claude 90% 错误源于上下文缺失
无 CLAUDE.md 时 Claude 错误率达 41%,12 条工程规则可将其压至 3%;规则强调前置思考、简单优先等实践原则。
𝕏 @servasyy_ai 🧵 Thread AI工程安全
AutoHedge与Swarm项目被宣称结合构建AI自动交易系统
原文仅提及将AutoHedge和Swarm两个GitHub项目结合,称可构建“最强大的AI自动交易系统”,但未提供具体技术细节、验证数据或可运行方案。
𝕏 @SunNeverSetsX 🧵 Thread AI开源金融
ChatGPT-Image2生成蜡笔风教案图片
教师用ChatGPT-Image2将教案转为竖版A4尺寸蜡笔风格图片,一次输出10张,适用于幼儿园和小学低年级公开课展示与家长沟通
𝕏 @MrLarus 🧵 Thread AI教育工具
Codex App 在三个维度实现对 Claude Code 的降维打击
用户称 Codex App 将 AI 操作电脑拆解为三种能力,其中内置浏览器 Browser 面向开发者,自动化能力已远超 Claude Code。
𝕏 @yaohui12138 🧵 Thread AI自动化开发工具
Barbara Oakley学习科学被转化为10个Claude提示词
基于Barbara Oakley《Learning How to Learn》课程(全球300万人参与)提炼出10个可操作AI提示词,覆盖专注/发散、分块、抗拖延、间隔重复等核心学习原理。
𝕏 @laobaishare 🧵 Thread 教育科技认知科学AI工具
Anthropic发布Claude Skills官方指南,将提示工程重构为‘文件夹工程’
该指南采用中英双语逐段对照排版,定义skill为一个含SKILL.md、可选scripts/和references/的文件夹结构,全部基于Markdown+YAML元数据规范。
𝕏 @GoSailGlobal 🧵 Thread AI工程开源
LangSmith Engine构建过程深度分享发布
LangChain团队成员hwchase17在𝕏平台分享LangSmith Engine开发经验,提及内部已启用早期版‘issue bench’工具
𝕏 @hwchase17 🧵 Thread AI工程开源
Corey Ganim构建Hermes智能体,整合Gbrain知识库与Fathom、Gmail
该Hermes智能体通过Gbrain(Garry Tan开发)作为知识库,并连接Fathom通话记录和Gmail邮件实现个性化;用户可为不同角色(如CFO、营销、运营)配置独立私有知识脑。
𝕏 @coreyganim 🧵 Thread AI工具知识管理
实测显示国外模型写作修改率低于国内模型
2026年5月真实工作流测试中,Claude 4.6完成全网爬热点流程无误,MiniMax复用相同工作流却反复出错。
𝕏 @rwayne 🧵 Thread AI工程商业
开发者用Cursor+Claude两小时复刻149美元Three.js海洋交互系统
该复刻版本实现海洋波浪动态、风速实时调节、天空环境光变化等物理交互功能,视觉与交互还原度超80%,并新增中英文双语支持。
𝕏 @berryxia 🧵 Thread AI开发工具WebGL
AI生成HTML页面替代Notion和PPT
用户用Claude Code在xhigh模式下2分多钟生成含暗色主题、时间线、可折叠风险表等交互功能的完整HTML页面,无需额外调试即可直接交付
𝕏 @AYi_AInotes 🧵 Thread AI前端生产力
Hermes Agent开源版支持跨22个应用运行
0.14版本显著降低安装门槛、提升Windows原生支持、加速浏览器自动化,并新增Teams集成与模型热切换能力
𝕏 @JulianGoldieSEO AI开源工程
查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部