最近有哪些值得关注的开源大模型

Question

最近有哪些值得关注的开源大模型

Accepted Answer

最近开源大模型领域出现了一系列值得关注的进展，多个模型在性能、上下文长度和可访问性上实现了突破，正在缩小与闭源顶级模型的差距。这些模型大多由中国团队推出，并且完全开源可商用，为开发者和企业提供了新的选择。

智谱AI的GLM-5.2是近期最受瞩目的开源模型之一。它支持100万token的上下文窗口，在编码和智能体任务上有大幅提升，智力指数榜单上得分51，仅落后于几个闭源模型，是目前排名最高的可公开权重模型[1][4]。评测显示其性能超过了Gemini 3.1 Pro，接近GPT 5.5和Opus 4.8，而且完全开源可商用[2]。用户可以在Together AI平台上用它完成读问题、梳理场景、修改代码的全流程编码任务[12]。

DeepSeek发布的模型同样引人关注，其参数量达到1.6万亿，上下文窗口也是100万token，并且完全免费开放下载和商用[6]。相比之下，OpenAI同类服务定价200美元/月，DeepSeek的开源策略对行业形成了直接冲击。这家实验室此前因训练成本远低于OpenAI、Anthropi而闻名，现已达到约450亿美元估值，正洽谈首轮融资，背后有国家集成电路产业投资基金等中国资本支持[11]。

MiniMax开源的M3模型参数超过2000亿，同样支持100万token上下文窗口[7]。这家公司的估值约为330亿美元[8]。另外，一个名为SuperQwen-Agentworld-35B的开源模型即将发布，发布者称其达到了新层级[5]。月之暗面旗下的Kimi系列也是重要角色，K2.5在编程基准测试中接近OpenAI和Anthropic的模型，K2.6已成为AI分发平台OpenRouter上使用量第二大的大语言模型，公司估值已达200亿美元[8]。

这些开源模型不仅在性能上逼近顶级闭源模型，在实用性上也值得关注。现在市场上最便宜的前沿级别大模型，只需0.18美元就能在浏览器里跑出接近顶级模型的性能[9]。用户甚至可以在本地电脑上运行性能接近顶级产品的免费AI，无需付费订阅或云端权限[10]。业内观点认为，开源大模型适配消费级硬件才是获胜路径[3]，而当前的开源模型确实正在向这个方向演进。

📬 订阅 AI Pulse