用日常对话就能编视频，Google连发AI新工具

📅 2026 年 5 月 30 日 📖 约 6 分钟 Google AI产品发布多模态

Google 今天发布了几项新模型和智能体产品，覆盖从视频生成到后台信息处理。

先看 Gemini Omni。它是一个新模型，能从视频等任意输入生成高质量视频，支持图像、音频、视频、文本组合输入，基于 Gemini 的真实世界知识。特别的是，它允许用自然语言编辑视频——每次编辑基于上一次，角色一致、物理规律保持、场景有记忆。Omni Flash 版本正在向全球 Google AI Plus、Pro、Ultra 订阅者推出，同时免费向 YouTube Shorts 和 YouTube Create App 用户开放。

然后是 Gemini 3.5 系列，首款模型是 3.5 Flash。它结合了前沿智能与行动能力，在智能体和编码方面表现突出，擅长复杂的长周期任务。与 Antigravity 框架配合，可以部署协作子智能体，可靠执行多步骤工作流和编码任务。3.5 Flash 已是 Gemini 应用和搜索中 AI Mode 的默认模型，也通过 Antigravity、Gemini API、AI Studio、Android Studio、Enterprise Agent Platform 和 Enterprise 普遍可用。

新功能方面，Google 推出了信息智能体（information agents）。它们将在后台 24/7 运行，智能推理信息，找到用户所需并发送综合更新和链接。今年夏天首先面向 Google AI Pro & Ultra 订阅者推出。

搜索也在升级。利用 3.5 Flash 的智能体编码能力，搜索可以动态构建定制生成式 UI，包括可视化工具和模拟，今年夏天免费向所有人开放。对于持续任务（如婚礼规划、健身计划），搜索会构建自定义仪表盘、追踪器或迷你应用，用户可反复使用。未来几个月内，美国 Google AI Pro 和 Ultra 订阅者还能在搜索中用 Antigravity 创建自己的自定义体验。

最后是 Gemini Spark，一个运行在 Gemini 3.5 上的个人 AI 智能体，使用 Antigravity 框架，24/7 运行，深度集成 Workspace 工具（Gmail、Docs、Slides 等）。它已面向美国 Google AI Ultra 订阅者可用。

这些产品中，有些已经上线，有些需要等到夏天或未来几个月。Google 似乎同时在多个方向发力——视频生成、搜索体验、个人助手和后台智能体——但每个功能的准入和付费门槛并不一样。

阅读原文

📚 相关主题产品发布多模态

📬 订阅 AI Pulse