我用AI克隆巴菲特和格雷厄姆，让他们联手自动化投资研究

📅 2026 年 6 月 4 日 📖 约 14 分钟 @Voxyz_ai on 𝕏 AI工程开源

我从二月起持续运行多智能体团队，用于内容写作、代码开发和研究工作。被问得最多的问题是：如何让它们真正协同工作？

答案与模型本身无关。过去几个月我最大的错误，是以为更聪明的模型就能产出更好结果。真正起决定作用的是如何安排角色、拆分任务、设置对立关系——升级的是组织架构图。

我最近接触到两个开源项目：TradingAgents（81k星）和AI Hedge Fund（59k星）。表面看都是投资研究框架，但深入后发现它们揭示了我独自摸索出的团队协作结构：分析师并行收集信息，多空研究员辩论，交易员综合判断，风控团队挑错，组合经理最终批准。两个项目都明确声明：这是为研究目的设计的工程模式，非投资建议。

投资研究只是外壳，真正值得研究的是其下的智能体团队架构。

本文拆解该结构，并提供可直接使用的建队模板。我关注的是：智能体团队如何分工、如何相互校验、如何留下可追溯的协作记录。投资研究恰好是最嘈杂、最高风险的场景，协作质量在此处最快暴露。

整套系统构建于Bloome平台。最直观的理解是：一个群聊，其中部分成员是AI智能体而非真人。你像添加联系人一样加入它们，为每个设定角色，所有人（含AI）在同一对话线程中交流。

可用的智能体团队必须通过五道关卡

经过跨领域构建多智能体团队数月实践，我将其浓缩为五项核心要求。

TradingAgents走红，正因为它将高风险判断拆解为这种可编排、可追溯的组织流程。这与“AI炒股”毫无关系。

这五道关卡需要一个实体空间来运行

单个聊天窗口难以承载全部五关。你可以写一条提示词：“请扮演巴菲特、格雷厄姆、多头、空头和负责人”，但这仍是单一模型在一次响应中模拟五个声音——它们没有真实座位，无法彼此看见。最常见结果是：声音不同，最终判断却仍是一团模糊。

我需要一个能让多个智能体真正看见彼此的空间。Bloome正是为此而设：人类与AI共处同一群聊，每个AI拥有独立角色卡与权限边界。“负责人”是群内真实成员，自带上下文，而非埋在提示词里的一段指令；“多头”与“空头”是两个独立智能体，能面对面反驳，而非同一回复里的两段文字。

你@全体成员提问，它们自动拆解问题、互相质疑、在线程内辩论，最后由负责人汇总成备忘录。这就像拉几位同事进群开会，区别在于：这些“同事”不会因礼貌而妥协，但若你未写清角色边界，它们真会踩到对方脚上。

Bloome在本文中是配角。它做的事很简单：把五道关卡转化为可见流程。

五道关卡如何映射到群聊中？

建队本身不难，难点在于为每个智能体写清边界：它负责什么、不能碰什么、何时必须移交负责人。

下文以投资研究为场景，逐一说明五道关卡。

第一关：负责人先拒收劣质问题

我在Bloome搭建投资研究团队后，首次@全体提问：“1000万美元投电动车，会发生什么？”

我等着有人抛出一只股票。没人回应。

负责人拦下了问题并反问：

对任何研究问题，负责人首先追问五点：
1. 投资金额是哪种货币？
2. 投资期限多久？
3. 这是私人投资还是公开市场？
4. 本次研究的目的是什么？
5. 有什么约束条件？

我提了一个劣质问题。负责人未急于作答，是这套系统有效的第一个信号。优秀负责人会在展示能力前，先将问题重塑为可回答形态。

我补充：“美元计价，三至五年期。仅限当前估值安全边际。” 它才放行并启动任务分配。

第二关：角色不是人设，而是过滤器

我配置了AI版巴菲特与AI版格雷厄姆。但克隆投资大师恰是多数人犯错之处。

错误做法：“你是巴菲特，请用巴菲特口吻分析这只股票。” 这只会产出一个Cosplay机器人。

正确做法是将大师思想转化为可执行的判断过滤器：

AI巴菲特角色卡：只评估“是否为十年后仍存续的伟大企业，且当前价格公允”。
AI格雷厄姆角色卡：只评估“是否为被低估的隐性资产，且当前价格留有足够安全边际”。

真正赋予大师级智能体价值的，是其背后稳定的过滤逻辑。它听起来像不像真人几乎无关紧要。AI Hedge Fund项目同样如此：格雷厄姆定义为“仅买入具备安全边际的隐藏宝石”，巴菲特定义为“寻找价格公允的伟大公司”。大师人设被翻译为可落地的投资过滤条件。

为何选这两位？因巴菲特与格雷厄姆天然相斥：一人永远看向十年后，另一人只关心今日的安全垫。无需人为制造冲突，其投资哲学本就对立。选角关键在于：角色张力应内生于设定，而非强行添加。

在Bloome上克隆一个角色只需几秒，整支团队几分钟即可上线。

我组建的团队包括：金融负责人、巴菲特、格雷厄姆、多头、空头。

第三关：对立双方不是表演，而是对抗确认偏误

单一AI最大缺陷是过度取悦用户——无论你说什么，它都附和。更换模型无法解决此问题，必须从架构层面修复。

除巴菲特与格雷厄姆外，我额外加入坚定多头与坚定空头。它们的任务不是发表意见，而是将双方观点推向极致：

多头/空头辩论协议：多头必须提供最乐观的买入理由，空头必须提供最悲观的卖出理由。

实践中，巴菲特智能体不断将讨论拉回一点：“这家公司十年后还会存在吗？” 格雷厄姆智能体拒绝参与该话题，只专注一点：“当前价格是否留有足够安全边际？股价最多可能下跌多少？” 一个看十年，一个看下行空间。它们就同一只股票反复交锋，谁也未能说服对方。

最终，分歧从情绪化转向可验证假设。这比直接选出赢家有用得多。

负责人将双方观点综合为我能真正理解的结论：巴菲特判断长期质量，格雷厄姆判断安全边际，负责人居中整合。

第四关：单助手模式为何在此失效？

我向单一默认助手提出类似问题，它迅速进入合规模式：“我无法提供投资建议。”

这并非缺点。金融类问题本就不该由单一助手仓促作答。

问题在于：单助手模式只有唯一出口——要么直接回答，要么拒绝。智能体团队则增加中间层：将“给我一只股票推荐”转化为“组织一场研究流程”。

因此，负责人先询问约束条件，专家拆解视角，多空双方摆出分歧，最终备忘录只给出下一步研究步骤，从不给出买卖指令。

底层模型未变，变化的是问题被置入组织化流程之中。

第五关：输出不是答案，而是决策备忘录

优秀的智能体团队应输出可追溯的决策记录：

决策备忘录模板：
- 推荐操作：无（仅列出下一步研究步骤）
- 关键假设：列出双方依赖的假设
- 分歧摘要：多头与空头的核心观点
- 结论失效条件：在什么情况下结论不再成立

当我提问“1000万美元投电动车”时，收到的不是“买”或“不买”，而是一份文档：列明双方论点、关键假设、以及结论失效的触发条件。

最新版TradingAgents增加了持久化决策日志。AI Hedge Fund同样强调智能体推理必须可调试。二者独立得出相同结论：无论智能体团队输出什么，事后都必须可审查。

该方法远超投资研究范畴

本次Bloome只是承载空间，而非方法边界。

我选用投资研究作为压力测试，因其嘈杂、高风险，且能最快暴露团队是否真正在相互校验。换成内容、代码、产品或销售场景，五道关卡依然适用：

投资：采集者（新闻/财报/技术指标）、专家（巴菲特/格雷厄姆）、对立者（多头/空头/风控）、负责人（组合经理）。
内容：采集者（资料搜集）、专家（写作者）、对立者（事实核查/观点挑战）、负责人（编辑）。
代码：采集者（代码库阅读）、专家（实现者）、对立者（评审/安全）、负责人（技术主管）。
产品：采集者（用户反馈）、专家（产品经理）、对立者（质疑型用户）、负责人（创始人）。
销售：采集者（线索调研）、专家（客户策略师）、对立者（异议处理者）、负责人（销售主管）。

多智能体的价值不在于数量，而在于让一个问题穿越多个判断位置。

欢迎亲自@这支团队

我没有用截图隐藏这支团队。这就是我实际搭建的群聊：同样的负责人、同样的AI巴菲特与格雷厄姆、同样的坚定多头与空头，全部坐于同一对话线程中。请进入体验，@团队并提出你的问题。

我尚未将其放入Arena竞技场。本文是一份团队构建笔记，而非竞赛复盘。但如果你想观看全自动团队在相同任务、相同数据、相同模拟约束下正面交锋，可前往Bloome Arena。重点不在单轮收益高低，而在观察不同团队如何分工、如何犯错、如何综合。

Bloome实盘交易竞技场：智能体团队以同等资金公开竞逐。

投资研究只是压力测试。真正值得关注的，是智能体团队在公开环境中所展现的组织能力。

需明确说明

本实验运行于Alpaca纸面交易模拟器。我不懂投资，本文亦非股票建议。我克隆的是基于公开投资哲学构建的AI角色，与真实人物无关。自始至终，我唯一好奇的是团队如何协作。最终选了哪只股票？我确实没太关注。

单个AI如同一位口才出色的实习生。优秀的智能体团队则更像一间小型会议室。你的任务不是让它们变得更聪明，而是安排谁收集信息、谁扮演反对者、谁标记风险、谁最后收拾桌面。

参考资料

- TradingAgents：开源多智能体投资研究框架，81k星。将高风险判断拆解为可编排、可追踪的协作流程（研究用途）。
- AI Hedge Fund：开源投资大师智能体系统，59k星。证明大师人设可转化为可执行的过滤条件（教育用途）。
- Bloome（bloome.im）：多智能体消息平台，智能体以队友身份加入你的群聊。
- Alpaca纸面交易：模拟交易平台，无需真实资金即可测试策略。

阅读原文

📚 相关主题工程开源