最近开源大模型领域出现了一系列值得关注的进展,多个模型在性能、上下文长度和可访问性上实现了突破,正在缩小与闭源顶级模型的差距。这些模型大多由中国团队推出,并且完全开源可商用,为开发者和企业提供了新的选择。

智谱AI的GLM-5.2是近期最受瞩目的开源模型之一。它支持100万token的上下文窗口,在编码和智能体任务上有大幅提升,智力指数榜单上得分51,仅落后于几个闭源模型,是目前排名最高的可公开权重模型[1][4]。评测显示其性能超过了Gemini 3.1 Pro,接近GPT 5.5和Opus 4.8,而且完全开源可商用[2]。用户可以在Together AI平台上用它完成读问题、梳理场景、修改代码的全流程编码任务[12]

DeepSeek发布的模型同样引人关注,其参数量达到1.6万亿,上下文窗口也是100万token,并且完全免费开放下载和商用[6]。相比之下,OpenAI同类服务定价200美元/月,DeepSeek的开源策略对行业形成了直接冲击。这家实验室此前因训练成本远低于OpenAI、Anthropi而闻名,现已达到约450亿美元估值,正洽谈首轮融资,背后有国家集成电路产业投资基金等中国资本支持[11]

MiniMax开源的M3模型参数超过2000亿,同样支持100万token上下文窗口[7]。这家公司的估值约为330亿美元[8]。另外,一个名为SuperQwen-Agentworld-35B的开源模型即将发布,发布者称其达到了新层级[5]。月之暗面旗下的Kimi系列也是重要角色,K2.5在编程基准测试中接近OpenAI和Anthropic的模型,K2.6已成为AI分发平台OpenRouter上使用量第二大的大语言模型,公司估值已达200亿美元[8]

这些开源模型不仅在性能上逼近顶级闭源模型,在实用性上也值得关注。现在市场上最便宜的前沿级别大模型,只需0.18美元就能在浏览器里跑出接近顶级模型的性能[9]。用户甚至可以在本地电脑上运行性能接近顶级产品的免费AI,无需付费订阅或云端权限[10]。业内观点认为,开源大模型适配消费级硬件才是获胜路径[3],而当前的开源模型确实正在向这个方向演进。