模型中立性比云中立性更重要
我们正处于软件开发的又一代际转变中。 每二十年左右,软件构建方式会发生一次根本性变化,迫使所有工程组织重构工作方式。上一次是本地部署转向云,这一次是代理(Agents)兴起——且它正在以月为单位推进,而非以年为单位。
每次转变都会引发相同问题:你依赖谁?多少业务逻辑被绑定在单一供应商身上?离开的成本有多高?上一次,企业大多迟滞作答。此后十年,它们为厂商锁定、价格不可预测和迁移失败持续付费。
模型领域正在重演这一过程。我们刚经历过上一轮,教训就在眼前。
云时代的教训来自HashiCorp时期。最核心的认知是:云厂商锁定的表层问题(宕机、定价权、容灾)容易理解;深层问题是他们实际销售的是什么。 他们销售的是大宗商品:存储、网络、计算。AWS存储与GCP存储在字节层面无法区分。正因底层产品是同质化商品,厂商维持客户消费的唯一可持续方式,是在工具层实施锁定:AWS CloudFormation、Azure ARM模板、GCP Vertex AI。 这些工具没有内在动力去平等地支持竞争对手的领先功能。那样只会降低客户流失门槛。 Terraform存在的全部理由,正是应对这种真实、昂贵且日益加剧的工具层锁定——提供向上一层的中立抽象:保留切换权利,支持单次部署中混合使用多家基础设施,无需重写代码。 这个方案赢了。不是一夜之间,但确实赢了。早期采用中立策略的企业,能对云厂商议价,因为退出是可信的;也能承受宕机,因为容灾不是理论假设。单厂商栈无法提供这两点。
基础模型实验室正在复制同一策略。 它们向你销售token。Token是大宗商品,且正变得更同质化。前沿模型间的差距持续收窄,开源权重模型快速追赶,百万token价格已连续两年稳步下降。实验室清楚这一点,它们看到的图表和你一样。 因此,它们下一步是锁定你在“harness”(代理运行时框架)层。Claude Agent SDK、OpenAI Agents API、Vertex AI Agent Builder,全部呈现相同结构。 如果它们控制了承载你业务逻辑的编排层,即使存在更优、更便宜或更适配的模型,你仍会持续消耗其token。 它们没有商业动机让自己的harness良好支持竞品模型。CloudFormation从不为GCP资源提供同等体验;Claude Agent SDK也没有理由让调用GPT、Gemini或Llama成为一等公民。对实验室而言,让竞品模型在自家harness中表现优异,等于直接损失收入。它们不会这么做。
harness锁定将比模型本身锁定更难解除,因为业务逻辑就运行在harness中。
模型中立性比云中立性更重要,原因有三: 第一,变化速率不同。企业不会月复一月地把应用从AWS迁到GCP,通常只在合同续签或宕机时行动,可能几年一次。但模型实验室每季度、甚至每月都在相互超越。被单家厂商锁定的团队,不仅暴露于宕机与涨价风险,更每次都被排除在最新技术跃进之外。 第二,模型正选择性地商品化。实验室竞相争夺harness层,正是因为基础能力(如通用推理、问答、摘要)的差异化正在消失。但并非所有维度都已商品化。当前Anthropic在编程任务上领先,OpenAI正快速追赶;OpenAI在多模态上占优。排名每几个月就变动一次。真实生产环境中的最优解,常是同一工作流中调用多个模型,按任务动态路由至当日表现最佳者。这只有在harness不偏袒任何模型时才可行。 第三,开源权重模型已成为现实选项:Kimi、Mistral、DeepSeek、Qwen。自托管在技术上已切实可行,而“自建私有云”对多数企业从未真正可行。因此中立不仅是防御手段,还能让你在同一代理中混合使用闭源与开源模型,按成本、速度或准确率路由任务,并在更优模型发布后立即切换。
模型时代还存在云时代没有的另一层:云中立性在合同续签或宕机时兑现;模型中立性则在单次代理执行中行使——例如编码步骤选Claude、图像步骤选GPT;某提供商限流时实时切换;对非关键任务自动降级至低价模型。云中立止步于合同;代理中立必须跟随每一次请求。
中立harness实际包含三点: 一是开源。你能逐行阅读全部代码。无隐藏逻辑,无静默数据捕获,无为厂商利益牺牲用户的设计。由模型实验室发布的闭源代理框架,无论营销如何宣称,都不中立。 二是开箱即用的多模型支持。同一harness,适配任意后端:GPT、Claude、Gemini、Llama、Mistral、DeepSeek、Qwen,以及你防火墙内自托管的任何模型。一份代理定义,所有提供商均被平等支持,因为无人拥有该抽象层。 三是感知模型特性,而非追求最低公分母。中立不等于假装所有模型可互换。每个前沿模型都有独特个性:优势任务、适用prompt模式、工具调用风格各不相同。优秀的中立harness提供模型profile,让你利用每个模型的强项,同时不被任何一家绑定。它赋予你切换的权利,而非强制你抹平差异。
Deep Agents与LangChain的核心设计正基于此:开源、多模型、感知模型特性。这是一个为超越任何单一模型厂商而构建的harness。
超大规模云厂商曾销售大宗商品并在工具层锁定用户;模型实验室如今销售大宗商品并试图在harness层锁定用户。Terraform靠成为云之上的中立层赢得云时代;中立、开源的harness,就是模型时代的对应答案。 区别在于,这次转变的速度比上一次快一个数量级,判断失误带来的代价也以同样倍数加速累积。