全双工多模态AI让人机对话不再需要轮流等候
现在的AI对话是轮流进行的:你说完它再说,像对讲机。John Schulman分享了全双工多模态模型的工作,让交互变得实时、自然、直观,而且不牺牲智能。
过去一周的演示表明,许多以前需要专用模型的任务,比如实时翻译和视频事件检测,现在通用模型通过零样本指令遵循就能完成。你可以同时说话、做手势、展示物品,AI能实时理解并回应,体验更像真人对话。
Thinky公司创立的部分目的就是差异化推进这种人机协作能力——这块目前相对被低估。
现在的AI对话是轮流进行的:你说完它再说,像对讲机。John Schulman分享了全双工多模态模型的工作,让交互变得实时、自然、直观,而且不牺牲智能。
过去一周的演示表明,许多以前需要专用模型的任务,比如实时翻译和视频事件检测,现在通用模型通过零样本指令遵循就能完成。你可以同时说话、做手势、展示物品,AI能实时理解并回应,体验更像真人对话。
Thinky公司创立的部分目的就是差异化推进这种人机协作能力——这块目前相对被低估。
每天两次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30 和 15:00 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00 和 14:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。