📡 X 信号

Prism发布早期预印本：实现大模型能力稀疏提取

@tokenbender 8.8K 浏览 · 91 喜欢 · 24 转推 · 55 收藏 AI研究工程

我们发布了《Prism：解锁语言模型能力提取》的完全可复现早期预印本。一个已训练的语言模型同时掌握大量知识，但部署通常每次只需求一种行为。企业场景往往产品数量少、工作流固定，

此前，在Prism所定义的“稀疏可部署能力提取”方面，并无清晰的方法论。当时最接近的SOTA是电路发现（circuit discovery）/特征提取（feature extraction）。我们从相同起点出发，但很快发现该方法在实现我们目标的过程中面临诸多挑战。

我们开发了一种称为“准直”（collimation）的方法。在准直中，我们对通道子集施加条件，以提升其在选定任务上的行为恢复效果，同时保持其本质上的低秩特性。在算术任务中，仅使用约5%的通道，即可恢复约90%的行为表现。该成果已于上月分享——

此后一个月内，我们成功实现了在8B规模模型上隔离函数调用能力。在Qwen3-8B BFCL上，原始恢复率在36.2%的通道基数下仅为19.1%；引入恰当的后归因目标（post-attribution objective）后，相同通道预算下的恢复率跃升至84.6%。

我们后续工作旨在将该方法进一步拓展至更复杂的用例与行为，并构建一种新型模型效率维度——该维度可叠加于现有方法之上，且仅带来极小性能损失。代码 — 论文 —

本文由 AI 翻译自英文原帖，技术名词保留英文。

📬 订阅 AI Pulse