AI Agent 有什么新框架 — AI Pulse 知识库

AI Agent 领域近期涌现了多个新框架，它们不再仅仅关注单一模型的能力，而是转向如何让多个代理高效协作、自主执行任务，并且大幅降低了使用门槛。一个标志性的开源框架来自 Firecrawl，它发布了 web-agent 架构，能让 AI 自动完成网页浏览、搜索、点击按钮和抓取数据等操作，无需人工编写爬虫代码。这个框架支持切换 Anthropic、OpenAI 或本地 Llama 等不同大模型，还可以部署在自有服务器上，并通过 Skill playbook 编写操作手册来实现自动翻页、跨站比价等复杂场景 ^[1]。

在代理团队协作方面，Paperclip 与 Hermes Agent 的组合形成了另一种新框架思路。Paperclip 提供管理结构，而 Hermes Agent 则为每个代理赋予持久记忆，从而构建出有序的 AI 代理团队。系统允许为每个代理分配角色、日程和执行限制，实现自动化编排。业界已经意识到，企业瓶颈正从模型访问转向代理编排，需要协调多个代理协同运行 ^[3]^[4]。Hermes Agent 本身也是免费开源项目，能够将 AI 从被动响应转变为主动执行 ^[5]，甚至可以在 NVIDIA 的 DGX Spark 上本地运行，完成多步骤任务 ^[6]。

针对 Agent 长期会话中上下文丢失的痛点，腾讯 AI 团队开源了一套记忆系统，能够实时压缩过期上下文，相比堆砌上下文长度的做法，这套方案直接砍掉了 61% 的 Token 消耗 ^[7]。此外，字节跳动在其企业级 AI 编程手册中推广了 Agentic AI 的原理，教非程序员通过写 skills、定 rules、连 MCP 来构建自己的代理 ^[9]。对于想快速上手的新用户，Bloome 平台提供了一个 15 分钟创建 AI Agent 的框架，允许设置付费使用模式，本质上是将个人工作流封装成可自动执行的任务 ^[10]^[11]。

有意思的是，开源的 MathModelAgent 能够自动完成数学建模全流程，甚至产出接近获奖水平的论文 ^[15]。同时，有观点指出不应按照传统职业分工来限制 AI Agent，多代理协作应发挥其全面能力，而不是模仿人类岗位 ^[16]^[17]。这些新框架共同展示了一个趋势：AI Agent 正从单点工具进化为可编排、可记忆、可部署的完整系统。

📬 订阅 AI Pulse