AI Agent 领域近期涌现了多个新框架,它们不再仅仅关注单一模型的能力,而是转向如何让多个代理高效协作、自主执行任务,并且大幅降低了使用门槛。一个标志性的开源框架来自 Firecrawl,它发布了 web-agent 架构,能让 AI 自动完成网页浏览、搜索、点击按钮和抓取数据等操作,无需人工编写爬虫代码。这个框架支持切换 Anthropic、OpenAI 或本地 Llama 等不同大模型,还可以部署在自有服务器上,并通过 Skill playbook 编写操作手册来实现自动翻页、跨站比价等复杂场景 [1]

在代理团队协作方面,Paperclip 与 Hermes Agent 的组合形成了另一种新框架思路。Paperclip 提供管理结构,而 Hermes Agent 则为每个代理赋予持久记忆,从而构建出有序的 AI 代理团队。系统允许为每个代理分配角色、日程和执行限制,实现自动化编排。业界已经意识到,企业瓶颈正从模型访问转向代理编排,需要协调多个代理协同运行 [3][4]。Hermes Agent 本身也是免费开源项目,能够将 AI 从被动响应转变为主动执行 [5],甚至可以在 NVIDIA 的 DGX Spark 上本地运行,完成多步骤任务 [6]

针对 Agent 长期会话中上下文丢失的痛点,腾讯 AI 团队开源了一套记忆系统,能够实时压缩过期上下文,相比堆砌上下文长度的做法,这套方案直接砍掉了 61% 的 Token 消耗 [7]。此外,字节跳动在其企业级 AI 编程手册中推广了 Agentic AI 的原理,教非程序员通过写 skills、定 rules、连 MCP 来构建自己的代理 [9]。对于想快速上手的新用户,Bloome 平台提供了一个 15 分钟创建 AI Agent 的框架,允许设置付费使用模式,本质上是将个人工作流封装成可自动执行的任务 [10][11]

有意思的是,开源的 MathModelAgent 能够自动完成数学建模全流程,甚至产出接近获奖水平的论文 [15]。同时,有观点指出不应按照传统职业分工来限制 AI Agent,多代理协作应发挥其全面能力,而不是模仿人类岗位 [16][17]。这些新框架共同展示了一个趋势:AI Agent 正从单点工具进化为可编排、可记忆、可部署的完整系统。