AI Pulse

全双工多模态AI让人机对话不再需要轮流等候

现在的AI对话是轮流进行的:你说完它再说,像对讲机。John Schulman分享了全双工多模态模型的工作,让交互变得实时、自然、直观,而且不牺牲智能。

过去一周的演示表明,许多以前需要专用模型的任务,比如实时翻译和视频事件检测,现在通用模型通过零样本指令遵循就能完成。你可以同时说话、做手势、展示物品,AI能实时理解并回应,体验更像真人对话。

Thinky公司创立的部分目的就是差异化推进这种人机协作能力——这块目前相对被低估。

📎 阅读原文 · @johnschulman2 on 𝕏

📬 订阅 AI Pulse

每天两次更新,不错过重要信号

▲ 回到顶部