AI Pulse

多模态

2 篇文章 · 17 条信号 · 持续更新

📡

Google刚发布的Gemma 4 12B,能在笔记本上直接跑多模态任务

𝕏2026 年 6 月 5 日
📡

Gemma 4 12B 能直接吃文字、图片、声音

𝕏2026 年 6 月 4 日
📡

通义千问新模型能看图说话了

𝕏2026 年 6 月 3 日
📡

MiniMax刚发布的M3,上下文窗口塞进了100万token

𝕏2026 年 6 月 1 日
📡

MiniMax发布首个多模态原生模型M3

𝕏2026 年 6 月 1 日
📖

用日常对话就能编视频,Google连发AI新工具

AI产品发布2026 年 5 月 30 日
📡

大模型突然会动手了——不是模拟,是真出动作

𝕏2026 年 5 月 30 日
📖

Borealis:训练音频大语言模型的开源配方(数据、代码、权重全公开)

AI开源2026 年 5 月 26 日
📡

30亿参数模型,能同时读图看视频写文字

𝕏2026 年 5 月 20 日
📡

字节开源Lance:图像视频通吃的小模型

𝕏2026 年 5 月 19 日
📡

HiDream 用一种新架构,在六个主流评测里同时刷榜,连少样本任务都稳了

𝕏2026 年 5 月 18 日
📡

全双工多模态AI让人机对话不再需要轮流等候

𝕏2026 年 5 月 14 日
📡

DeepSeek新论文《Thinking with Visual Primitives》疑似被撤回

𝕏2026 年 5 月 2 日
📡

AI看图思考,靠画框打点

𝕏2026 年 5 月 1 日
📡

一个模型同时看图和画画?

𝕏2026 年 4 月 27 日
📡

Gemini新嵌入模型能跨五种媒体理解语义

𝕏2026 年 4 月 25 日
📡

270亿参数多模态模型开源了

𝕏2026 年 4 月 23 日
📡

Kling AI技能上线,不用配模型

𝕏2026 年 4 月 16 日
📡

40亿参数模型,本地电脑秒识海豚和章鱼

𝕏2026 年 4 月 5 日

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部