用日常对话就能编视频,Google连发AI新工具
Google 今天发布了几项新模型和智能体产品,覆盖从视频生成到后台信息处理。
先看 Gemini Omni。它是一个新模型,能从视频等任意输入生成高质量视频,支持图像、音频、视频、文本组合输入,基于 Gemini 的真实世界知识。特别的是,它允许用自然语言编辑视频——每次编辑基于上一次,角色一致、物理规律保持、场景有记忆。Omni Flash 版本正在向全球 Google AI Plus、Pro、Ultra 订阅者推出,同时免费向 YouTube Shorts 和 YouTube Create App 用户开放。
然后是 Gemini 3.5 系列,首款模型是 3.5 Flash。它结合了前沿智能与行动能力,在智能体和编码方面表现突出,擅长复杂的长周期任务。与 Antigravity 框架配合,可以部署协作子智能体,可靠执行多步骤工作流和编码任务。3.5 Flash 已是 Gemini 应用和搜索中 AI Mode 的默认模型,也通过 Antigravity、Gemini API、AI Studio、Android Studio、Enterprise Agent Platform 和 Enterprise 普遍可用。
新功能方面,Google 推出了信息智能体(information agents)。它们将在后台 24/7 运行,智能推理信息,找到用户所需并发送综合更新和链接。今年夏天首先面向 Google AI Pro & Ultra 订阅者推出。
搜索也在升级。利用 3.5 Flash 的智能体编码能力,搜索可以动态构建定制生成式 UI,包括可视化工具和模拟,今年夏天免费向所有人开放。对于持续任务(如婚礼规划、健身计划),搜索会构建自定义仪表盘、追踪器或迷你应用,用户可反复使用。未来几个月内,美国 Google AI Pro 和 Ultra 订阅者还能在搜索中用 Antigravity 创建自己的自定义体验。
最后是 Gemini Spark,一个运行在 Gemini 3.5 上的个人 AI 智能体,使用 Antigravity 框架,24/7 运行,深度集成 Workspace 工具(Gmail、Docs、Slides 等)。它已面向美国 Google AI Ultra 订阅者可用。
这些产品中,有些已经上线,有些需要等到夏天或未来几个月。Google 似乎同时在多个方向发力——视频生成、搜索体验、个人助手和后台智能体——但每个功能的准入和付费门槛并不一样。