AI Pulse

现在连行政同事都能随手生成以假乱真的AI语音

现在连行政同事都能随手生成以假乱真的AI语音

Gemini 3.1 Flash TTS 现在能在 Google AI Studio、Vertex AI 和 Google Vids 里直接试用。开发者、小公司甚至行政同事,点几下就能生成语音。

它在人工盲测里拿了 1211 分的 Elo 得分,是 Gemini 家族目前最高的。听众普遍觉得这声音不像机器念稿,倒像饭馆里邻桌聊天——自然,还带点情绪。

现在你可以在文本里直接写“(停顿两秒)”或“(轻声,带怀疑)”,不用碰参数也不用写代码。Google AI Studio 还配了界面,能给不同角色分配音色,设定场景氛围,节奏语调随手调。

高质量语音以前是大厂专利,现在中小团队也能负担。它支持 70 多种语言,多人对白直接喂进去,AI 自动分角色、保语气,不用你手动切片拼接。

所有音频都嵌了 SynthID 水印。哪怕被剪进短视频、转成 MP3 再转发十次,系统照样认得出这是 AI 生成的。水印不是为了锁死你,而是让源头可查——毕竟,谁也不想哪天发现自己播的新闻配音是别人伪造的。

牛皮吹爆了?反正我试完第一句就关掉了旧方案。

📎 阅读原文 · Google