多模态 — AI Pulse · 主题知识库

📡

Meta出了第一个真·AI图像生成智能体

𝕏2026 年 7 月 8 日

📡

全新350亿参数开源多模态大语言模型发布

𝕏2026 年 7 月 6 日

📡

多模态提示是AI智能体交互的未来方向

𝕏2026 年 7 月 5 日

📡

研究人员提出面向智能体的多模态提示交互方法

𝕏2026 年 7 月 5 日

📡

MiniMax发布开源多模态大模型M3，支持1M上下文与智能体能力

𝕏2026 年 6 月 14 日

📡

阶跃星辰Step 3.7 Flash开源：400 Token/s稀疏MoE多模态大模型

𝕏2026 年 6 月 9 日

📡

Google刚发布的Gemma 4 12B，能在笔记本上直接跑多模态任务

𝕏2026 年 6 月 5 日

📡

Gemma 4 12B 能直接吃文字、图片、声音

𝕏2026 年 6 月 4 日

📡

通义千问新模型能看图说话了

𝕏2026 年 6 月 3 日

📡

MiniMax刚发布的M3，上下文窗口塞进了100万token

𝕏2026 年 6 月 1 日

📡

MiniMax发布首个多模态原生模型M3

𝕏2026 年 6 月 1 日

📖

用日常对话就能编视频，Google连发AI新工具

AI产品发布2026 年 5 月 30 日

📡

大模型突然会动手了——不是模拟，是真出动作

𝕏2026 年 5 月 30 日

📖

Borealis：训练音频大语言模型的开源配方（数据、代码、权重全公开）

AI开源2026 年 5 月 26 日

📡

30亿参数模型，能同时读图看视频写文字

𝕏2026 年 5 月 20 日

📡

字节开源Lance：图像视频通吃的小模型

𝕏2026 年 5 月 19 日

📡

HiDream 用一种新架构，在六个主流评测里同时刷榜，连少样本任务都稳了

𝕏2026 年 5 月 18 日

📡

全双工多模态AI让人机对话不再需要轮流等候

𝕏2026 年 5 月 14 日

📡

DeepSeek新论文《Thinking with Visual Primitives》疑似被撤回

𝕏2026 年 5 月 2 日

📡

AI看图思考，靠画框打点

𝕏2026 年 5 月 1 日

📡

一个模型同时看图和画画？

𝕏2026 年 4 月 27 日

📡

Gemini新嵌入模型能跨五种媒体理解语义

𝕏2026 年 4 月 25 日

📡

270亿参数多模态模型开源了

𝕏2026 年 4 月 23 日

📡

Kling AI技能上线，不用配模型

𝕏2026 年 4 月 16 日

📡

40亿参数模型，本地电脑秒识海豚和章鱼

𝕏2026 年 4 月 5 日