Arcee AI模型独家托管Hugging Face,下载更快且企业无锁定
Arcee AI和Hugging Face签了份数百万美元的独家合作协议。今后Arcee所有模型、数据集和代理轨迹——公开的和私有的——都只放在Hugging Face上分发。
这是第一个用Hugging Face的私有存储产品Buckets替换AWS S3的主要美国AI实验室。Buckets按TB计费,出口流量和CDN打包在内,针对AI工件做了读写优化。
对Arcee来说,Buckets让训练变得计算无关。团队可以在任意云上跑训练,看哪边便宜就在哪开集群。模型和数据跟着走,没有出口费,也没有供应商锁定。简单说,Arcee不再被AWS绑死。
对下载和使用Arcee模型的用户,这次迁移最直接的变化是:所有工件都通过Hugging Face这个平台分发,它每月服务数十亿次下载。Arcee的模型月下载量超10万次,历史总量已达数百万级。企业客户面对的是一条经过验证的供应链——Hugging Face现在是所有Arcee工件的单一事实来源。
Arcee专注小型专用模型,已经部署在全球一些最大型企业里。他们的想法是:不需要万亿参数也能出顶尖结果。在Hugging Face上,Arcee以验证组织身份发布了204个模型和63个数据集。
旗舰开放模型包括Trinity系列(Trinity-Mini、Trinity-Nano、Trinity-Large-Thinking)、AFM-4.5B基础模型(仅基础模型下载超16万)、Llama-3.1-SuperNova-Lite(下载超10万)和Virtuoso系列。Arcee开放的数据集也被其他实验室拿来训练,比如The-Tome(175万条精选指令样本)、agent-data(函数调用)和Llama-405B-Logits蒸馏数据集(用于训练INTELLECT-1)。
过去一年下载量和二次创作最多的开放模型,越来越多来自美国以外。Hugging Face CEO Clément Delangue说,Arcee是美国开源AI的典范——小团队发世界级开放模型,企业真在生产环境跑。Arcee CEO Mark McQuade则表示,Hugging Face是AI的所在地,独家存储是自然选择,因为它是AI工件最好的基础设施。
合作的具体内容:所有Arcee模型和数据集(公开和私有)在Hugging Face Hub上独家存储和分发;Arcee成为Hub上的旗舰组织;双方共同致力于开放美国AI。首批联合发布的作品已经在筹备中。
财务条款只说了“数百万美元”,具体数字没披露。Arcee是否完全停用AWS S3也没明确。企业客户的价格和服务条款变化同样没细说。但有一点是确定的:模型存储基础设施正在从通用云服务向AI专用平台倾斜——Arcee是第一个这么做的美国主要AI实验室。