AI 代理正从简单的问答工具转向能够自主持续运行的循环系统,这个转变被 Claude Code 团队的核心成员明确概括为「不跟 agent 对话,跟 loop 对话」[1]。传统上用户写一条提示词、得到一次回复,然后手动决定下一步,这种模式将大量决策和迭代工作留给了人类。loop 的核心理念是将整个任务执行流程封装成一个自动循环,让 AI 自己决定每一步干什么,用户只需要定义目标、提供工具和上下文,剩下的探索与修正由模型自主完成。Claude Code 从 4.6 版本起全面开放 auto mode,正是这一方向的产品化落地,创始人 Boris 本人也彻底放弃手动编写 prompt,转而用 loops 实现编程任务的自动化 [2]。
在 Claude Code 中,/loop 命令是实现定时重复运行的主要手段。用户可以在终端中执行 /loop <interval>,让 Claude 每隔一定时间自动执行一次当前任务,最长可延续 3 天 [11]。对于更长时间跨度的任务,还有 /schedule 命令作为云端版本,即使合上笔记本电脑也能继续运行 [11]。使用时可结合 /goal 设置硬性完成要求,避免循环无限执行下去 [8]。开发者还可以为循环设置明确的 token 使用预算,例如「使用 10000 个 token」作为上限,从而控制成本 [8]。这种能力让原本需要人工定时检查和重复操作的场景——比如分类、研究、验证——完全变成自动流程。
除定时循环之外,另一种重要的模式是「AI judge loop」,即让 AI 在生成内容后自我审查和迭代。JulianGoldieSEO 提出的五步闭环包括生成、审查、评分、定位弱点、修正 [4]。这套流程的关键在于,很多人在使用 AI 写公众号推文时只执行了第一步生成,剩下的校对和迭代全部留给了自己,而 judge loop 将这部分也交给 AI 自动执行。操作上,用户可以设计一个动态工作流,提示模型先写内容,然后让模型自己扮演裁判,逐条评估质量,找出漏洞,最后要求模型基于反馈重写。Claude Code 的动态工作流功能允许用户通过自定义规则在代码执行的各个节点插入控制逻辑,实现类似传统 CI 流程的自动化,judge loop 正是这类工作流的一个典型用例 [5][8]。
更进一步的「autonomous loop」则赋予代理持续学习和探索的能力。Stash 项目提供了一个 5 分钟研究循环的示例:代理从过去记忆定位当前状态,主动选择一个自己感兴趣的话题进行搜索,发现新连接,巩固学习成果,然后优雅关闭,等待下一次触发 [14]。这个循环可以作为 cron 定时任务运行,每 5 分钟执行一次,代理由此不断积累知识和工作风格,而不仅仅是存储事实。Claude Design 系统同样依托 Agentic Loop 运行,它在浏览器中用虚拟机模拟环境,内置 24 个技能和 45 个工具,靠循环机制持续执行任务 [6]。本质上,loop 正在成为新一代 AI 应用的基础运行时,而不是一个可选的附加功能。新的大语言模型能够持续无中断运行更长时间,循环正是利用这一能力的主要方式之一 [7]。
在实际生产环境中,loop 已经产生了惊人的效率提升。有开发者利用 AI 并发跑 issue 和构建各种 loop,一天产出 1 万到 3 万行以上有效代码 [10]。Anthropic 的工程负责人透露,他的手机 Claude App 常驻 5 到 10 个 session、几百个 Agent,夜间还有几千个在跑深度任务,这些全部通过 cron 定时触发,每分钟、每五分钟或每天执行一次 [13]。值得注意的是,Anthropic 在封禁 OpenClaw 时并没有封禁 /loop 命令或自建 agent 脚本,说明他们承认人们使用循环完成自动化工作,只是不允许将订阅变成可复用的基础设施接口 [15]。这意味着 loop 本身是被平台认可的高级用法,关键在于遵守服务的定价边界。
从工程实现角度看,agent loop 的核心是模型流、工具调用和状态管理。一个典型的 agent loop 结构包含:初始化上下文、输入信息、调用模型、解析输出(可能是工具调用或文本响应)、执行工具、更新内存、循环回到输入 [3][9]。Claude Code 通过 Harness 机制提供钩子系统,让开发者精确控制模型行为,而动态工作流则允许在代码执行的各个节点插入自定义规则 [5]。多智能体编排的原生支持,包括有向无环图、记忆机制和调度器,进一步提升了 loop 的扩展能力 [5]。这些底层组件共同构成了一套完整的编排体系,让 loop 不再只是一个简单的重复运行,而是可配置、可组合、可控制的生产级自动化方案。