AI Pulse
📡 X 信号

Prism发布早期预印本:实现大模型能力稀疏提取

我们发布了《Prism:解锁语言模型能力提取》的完全可复现早期预印本。一个已训练的语言模型同时掌握大量知识,但部署通常每次只需求一种行为。企业场景往往产品数量少、工作流固定,

此前,在Prism所定义的“稀疏可部署能力提取”方面,并无清晰的方法论。当时最接近的SOTA是电路发现(circuit discovery)/特征提取(feature extraction)。我们从相同起点出发,但很快发现该方法在实现我们目标的过程中面临诸多挑战。

我们开发了一种称为“准直”(collimation)的方法。在准直中,我们对通道子集施加条件,以提升其在选定任务上的行为恢复效果,同时保持其本质上的低秩特性。在算术任务中,仅使用约5%的通道,即可恢复约90%的行为表现。该成果已于上月分享——

此后一个月内,我们成功实现了在8B规模模型上隔离函数调用能力。在Qwen3-8B BFCL上,原始恢复率在36.2%的通道基数下仅为19.1%;引入恰当的后归因目标(post-attribution objective)后,相同通道预算下的恢复率跃升至84.6%。

我们后续工作旨在将该方法进一步拓展至更复杂的用例与行为,并构建一种新型模型效率维度——该维度可叠加于现有方法之上,且仅带来极小性能损失。代码 — 论文 —

本文由 AI 翻译自英文原帖,技术名词保留英文。

查看 X 原帖

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部