AI Pulse

AI写代码不再一股脑:像靠谱同事,先跟你确认再动手

AI写代码不再一股脑:像靠谱同事,先跟你确认再动手

用AI写代码最怕什么?你给了一个需求,它一口气吐出几百行代码,结果方向偏了,你只能从头改。EvanFlow打算改变这件事。

它叫“TDD驱动的迭代反馈循环”,由16个技能和2个自定义子代理组成。工作流程很清楚:先用自然语言头脑风暴想法,然后让AI给出计划,你批准后它再执行——可以顺序执行,也可以并行执行。每走一个代码单元,AI自己写测试、跑测试,然后停下来等你检查。最多迭代5次,之后强制停止。

每一步都有实体的检查点:设计批准、计划批准、每次迭代后复查。AI不是自动驾驶,更像一个指挥者,每小节等你翻页。

为了不让AI失控,EvanFlow有硬性规则:绝不虚构任何值——文件路径、环境变量、函数名、库API,不确定就停下来问你。研究显示62%的LLM生成的测试断言是错的。行业数据还表明,约65%的企业AI编码失败可追溯到上下文漂移(并非单纯超出Token上限),EvanFlow通过分步约束把这个问题提前截住。

迭代阶段配有5项失败模式检查清单:幻觉操作、范围蔓延、级联错误、上下文丢失、工具误用。一旦触犯,循环会提示你暂停。

对于有3个以上真正独立单元的计划,EvanFlow会分叉为并行编码模式:每个单元配一个编码器,每个编码器配一个只读监督员(子代理),外加一个集成监督员。这套编排增加了可靠性,但也对用户的项目组织能力有要求——目前不清楚在复杂依赖关系中它的表现如何。

最让人放心的可能是它永远不会自动操作git。它不会自己提交、暂存或推送代码,所有git操作都要你明确指示。它还配了一个git防护钩子,阻止git push、git reset --hard、git clean -f等破坏性操作。不过这个钩子依赖jq工具来解析Claude的JSON输入,如果jq没装,防护会静默失效——安装文档里明确提醒了这个坑。

使用门槛不高。没有“技能税”——你随时可以问临时问题,不用专门调用某个技能。推荐安装方式是通过Claude Code的插件市场,两条命令即可。技能本身设计为可编辑,鼓励你根据项目自定义。项目使用MIT许可证,完全开源。

如果你习惯让AI帮你搞定大部分代码,但总在最后发现方向不对,EvanFlow可能是那个让你少删几次重写的工具。

📎 阅读原文 · GitHub

📬 订阅 AI Pulse

每天两次更新,不错过重要信号

▲ 回到顶部