最近开源模型发布情况 2025

Question

最近开源模型发布情况 2025

Accepted Answer

近期，开源大模型领域迎来了一波密集发布，多家中国公司相继推出重量级模型，在参数量、上下文长度、推理效率等维度上形成激烈竞争。这些模型均在2026年第二季度公开，与2025年的发布节奏相比更为紧凑，并且都采取了开源策略，显著降低了开发者使用顶尖AI能力的门槛。

最受关注的是DeepSeek于2026年4月发布的V4系列，包含Pro和Flash两个版本 [4]。其中Pro版总参数量达到1.6万亿，是当时公开可下载的最大权重模型，但实际推理时仅激活部分参数以控制成本 [8]。在推理任务上，V4几乎追平GPT-5.4等顶尖闭源模型，不过在知识类测试中仍有3至6个月的差距 [8]。价格方面，Flash版本输入成本仅为0.14美元/百万token，比GPT-5.4等闭源模型低10到50倍，创造了开源模型在性价比上的新纪录 [4][8]。

腾讯在2026年4月发布的Hy3 LLM（Hy3 Preview）凭借2950亿参数的MoE架构引发关注，它实际推理时仅激活约21B参数，原生支持256K超长上下文窗口——比同期多数国产开源模型的上下文长度多出一倍 [5]。这一设计使其在处理长文档和复杂推理场景时具备显著优势，并在OpenRouter模型排行榜上意外霸榜，成为国产开源模型在API调用赛道上的一个代表性案例 [5]。

阿里在2026年4月17日开源的Qwen3.6-35B-A3B同样采用了稀疏MoE结构，35B总参数中激活3B，擅长编程任务 [20]。它在编程任务上的表现接近千亿级模型，但推理成本更低。GitHub上已有开发者将其部署在24G显存的消费级显卡上运行Agent，证明其实际部署门槛已经大幅降低 [20]。

小米也在2026年4月下旬发布了一款开源大模型，虽然官方未透露具体技术指标和用途，但被描述为“incredibly good” [17]。结合小米此前已推出中国最畅销电动车，这一动作被外界视为其在AI领域加速生态布局的信号 [17]。

此外，与模型发布配套的开源工具链也在同步完善。例如Models.dev项目将多个AI模型的规格、定价、能力整理为统一格式并提供API调用 [1]；whichllm工具能自动检测硬件并从HuggingFace推荐最适合的模型，RTX 4090上Qwen3.6-27B量化版得分92.8 [12]；GoModel则是一个用Go写的开源AI网关，可以零代码切换GPT-4到Claude等模型 [9][10]。这些工具进一步降低了开发者利用最新开源模型的门槛。

📬 订阅 AI Pulse