AI排行榜工具PapersWithCode复活,自动抓取论文和代码
返回文章列表
大家好,
我是Niels,来自Hugging Face的开源团队。距离我推出paperswithcode.co已经过去一周,这个网站重现了我们曾经喜爱的平台。它让我们能够追踪人工智能各领域的最新进展(SOTA),涵盖从智能体到计算机视觉和时间序列预测等多个方向。
该网站在X、LinkedIn和r/machinelearning上反响热烈——这些平台包含了一个发布视频,我很期待在未来几个月内进一步扩展这一项目。
本周,我新增了以下功能:
支持基准测试的多种指标:排行榜现在支持多种指标,例如自动语音识别的Open ASR排行榜,同时支持词错误率(WER)和逆实时因子(RTFx)指标;目标检测排行榜除了COCO数据集上的平均精度均值(mAP)外,现在也报告每秒帧数(FPS)。
支持外部论文:我们支持提交Arxiv以外的论文,例如GitHub仓库、博客文章、BiorXiv等。您可以在paperswithcode.co/submit提交论文。人工智能会自动丰富论文的任务和方法标签、GitHub仓库、评估结果等信息。例如下方未在Arxiv上发布的DeepSeek-v4:
支持论文谱系:当一篇论文有后续或前身时,会在摘要上方显示一个小横幅。例如Mamba-3、DINOv2和GLM-4.5。
新方法:基于流行度支持新方法,包括Gated DeltaNet、Kimi Delta Attention、Mamba-2等。每种方法还会列出所有引用它的论文。所有支持的方法可在此处查看。
支持排行榜截图以便在社交媒体上轻松分享:每个基准测试现在在散点图和表格上都包含一个“复制图像”按钮,可用于社交媒体分享。例如,在ClawEval上尝试此功能。
新增更多评估结果:我们正在逐步添加评估结果,从Transformers库中支持的所有模型开始。到目前为止,我们已有约3000个评估结果!您可以在每篇论文页面的底部找到它们,例如Qwen 3.6。
很高兴听到更多功能请求和反馈!
我还将在Hugging Face的Discord服务器上开设一个频道,以便更便捷地沟通。您也可以在此GitHub讨论串中参与讨论。
祝好, Niels