近期,开源大模型领域迎来了一波密集发布,多家中国公司相继推出重量级模型,在参数量、上下文长度、推理效率等维度上形成激烈竞争。这些模型均在2026年第二季度公开,与2025年的发布节奏相比更为紧凑,并且都采取了开源策略,显著降低了开发者使用顶尖AI能力的门槛。

最受关注的是DeepSeek于2026年4月发布的V4系列,包含Pro和Flash两个版本 [4]。其中Pro版总参数量达到1.6万亿,是当时公开可下载的最大权重模型,但实际推理时仅激活部分参数以控制成本 [8]。在推理任务上,V4几乎追平GPT-5.4等顶尖闭源模型,不过在知识类测试中仍有3至6个月的差距 [8]。价格方面,Flash版本输入成本仅为0.14美元/百万token,比GPT-5.4等闭源模型低10到50倍,创造了开源模型在性价比上的新纪录 [4][8]

腾讯在2026年4月发布的Hy3 LLM(Hy3 Preview)凭借2950亿参数的MoE架构引发关注,它实际推理时仅激活约21B参数,原生支持256K超长上下文窗口——比同期多数国产开源模型的上下文长度多出一倍 [5]。这一设计使其在处理长文档和复杂推理场景时具备显著优势,并在OpenRouter模型排行榜上意外霸榜,成为国产开源模型在API调用赛道上的一个代表性案例 [5]

阿里在2026年4月17日开源的Qwen3.6-35B-A3B同样采用了稀疏MoE结构,35B总参数中激活3B,擅长编程任务 [20]。它在编程任务上的表现接近千亿级模型,但推理成本更低。GitHub上已有开发者将其部署在24G显存的消费级显卡上运行Agent,证明其实际部署门槛已经大幅降低 [20]

小米也在2026年4月下旬发布了一款开源大模型,虽然官方未透露具体技术指标和用途,但被描述为“incredibly good” [17]。结合小米此前已推出中国最畅销电动车,这一动作被外界视为其在AI领域加速生态布局的信号 [17]

此外,与模型发布配套的开源工具链也在同步完善。例如Models.dev项目将多个AI模型的规格、定价、能力整理为统一格式并提供API调用 [1];whichllm工具能自动检测硬件并从HuggingFace推荐最适合的模型,RTX 4090上Qwen3.6-27B量化版得分92.8 [12];GoModel则是一个用Go写的开源AI网关,可以零代码切换GPT-4到Claude等模型 [9][10]。这些工具进一步降低了开发者利用最新开源模型的门槛。