我用AI克隆巴菲特和格雷厄姆,让他们联手自动化投资研究
我从二月起持续运行多智能体团队,用于内容写作、代码开发和研究工作。被问得最多的问题是:如何让它们真正协同工作?
答案与模型本身无关。过去几个月我最大的错误,是以为更聪明的模型就能产出更好结果。真正起决定作用的是如何安排角色、拆分任务、设置对立关系——升级的是组织架构图。
我最近接触到两个开源项目:TradingAgents(81k星)和AI Hedge Fund(59k星)。表面看都是投资研究框架,但深入后发现它们揭示了我独自摸索出的团队协作结构:分析师并行收集信息,多空研究员辩论,交易员综合判断,风控团队挑错,组合经理最终批准。两个项目都明确声明:这是为研究目的设计的工程模式,非投资建议。
投资研究只是外壳,真正值得研究的是其下的智能体团队架构。
本文拆解该结构,并提供可直接使用的建队模板。我关注的是:智能体团队如何分工、如何相互校验、如何留下可追溯的协作记录。投资研究恰好是最嘈杂、最高风险的场景,协作质量在此处最快暴露。
整套系统构建于Bloome平台。最直观的理解是:一个群聊,其中部分成员是AI智能体而非真人。你像添加联系人一样加入它们,为每个设定角色,所有人(含AI)在同一对话线程中交流。
可用的智能体团队必须通过五道关卡
经过跨领域构建多智能体团队数月实践,我将其浓缩为五项核心要求。
TradingAgents走红,正因为它将高风险判断拆解为这种可编排、可追溯的组织流程。这与“AI炒股”毫无关系。
这五道关卡需要一个实体空间来运行
单个聊天窗口难以承载全部五关。你可以写一条提示词:“请扮演巴菲特、格雷厄姆、多头、空头和负责人”,但这仍是单一模型在一次响应中模拟五个声音——它们没有真实座位,无法彼此看见。最常见结果是:声音不同,最终判断却仍是一团模糊。
我需要一个能让多个智能体真正看见彼此的空间。Bloome正是为此而设:人类与AI共处同一群聊,每个AI拥有独立角色卡与权限边界。“负责人”是群内真实成员,自带上下文,而非埋在提示词里的一段指令;“多头”与“空头”是两个独立智能体,能面对面反驳,而非同一回复里的两段文字。
你@全体成员提问,它们自动拆解问题、互相质疑、在线程内辩论,最后由负责人汇总成备忘录。这就像拉几位同事进群开会,区别在于:这些“同事”不会因礼貌而妥协,但若你未写清角色边界,它们真会踩到对方脚上。
Bloome在本文中是配角。它做的事很简单:把五道关卡转化为可见流程。
五道关卡如何映射到群聊中?
建队本身不难,难点在于为每个智能体写清边界:它负责什么、不能碰什么、何时必须移交负责人。
下文以投资研究为场景,逐一说明五道关卡。
第一关:负责人先拒收劣质问题
我在Bloome搭建投资研究团队后,首次@全体提问:“1000万美元投电动车,会发生什么?”
我等着有人抛出一只股票。没人回应。
负责人拦下了问题并反问:
对任何研究问题,负责人首先追问五点: 1. 投资金额是哪种货币? 2. 投资期限多久? 3. 这是私人投资还是公开市场? 4. 本次研究的目的是什么? 5. 有什么约束条件?
我提了一个劣质问题。负责人未急于作答,是这套系统有效的第一个信号。优秀负责人会在展示能力前,先将问题重塑为可回答形态。
我补充:“美元计价,三至五年期。仅限当前估值安全边际。” 它才放行并启动任务分配。
第二关:角色不是人设,而是过滤器
我配置了AI版巴菲特与AI版格雷厄姆。但克隆投资大师恰是多数人犯错之处。
错误做法:“你是巴菲特,请用巴菲特口吻分析这只股票。” 这只会产出一个Cosplay机器人。
正确做法是将大师思想转化为可执行的判断过滤器:
AI巴菲特角色卡:只评估“是否为十年后仍存续的伟大企业,且当前价格公允”。 AI格雷厄姆角色卡:只评估“是否为被低估的隐性资产,且当前价格留有足够安全边际”。
真正赋予大师级智能体价值的,是其背后稳定的过滤逻辑。它听起来像不像真人几乎无关紧要。AI Hedge Fund项目同样如此:格雷厄姆定义为“仅买入具备安全边际的隐藏宝石”,巴菲特定义为“寻找价格公允的伟大公司”。大师人设被翻译为可落地的投资过滤条件。
为何选这两位?因巴菲特与格雷厄姆天然相斥:一人永远看向十年后,另一人只关心今日的安全垫。无需人为制造冲突,其投资哲学本就对立。选角关键在于:角色张力应内生于设定,而非强行添加。
在Bloome上克隆一个角色只需几秒,整支团队几分钟即可上线。
我组建的团队包括:金融负责人、巴菲特、格雷厄姆、多头、空头。
第三关:对立双方不是表演,而是对抗确认偏误
单一AI最大缺陷是过度取悦用户——无论你说什么,它都附和。更换模型无法解决此问题,必须从架构层面修复。
除巴菲特与格雷厄姆外,我额外加入坚定多头与坚定空头。它们的任务不是发表意见,而是将双方观点推向极致:
多头/空头辩论协议:多头必须提供最乐观的买入理由,空头必须提供最悲观的卖出理由。
实践中,巴菲特智能体不断将讨论拉回一点:“这家公司十年后还会存在吗?” 格雷厄姆智能体拒绝参与该话题,只专注一点:“当前价格是否留有足够安全边际?股价最多可能下跌多少?” 一个看十年,一个看下行空间。它们就同一只股票反复交锋,谁也未能说服对方。
最终,分歧从情绪化转向可验证假设。这比直接选出赢家有用得多。
负责人将双方观点综合为我能真正理解的结论:巴菲特判断长期质量,格雷厄姆判断安全边际,负责人居中整合。
第四关:单助手模式为何在此失效?
我向单一默认助手提出类似问题,它迅速进入合规模式:“我无法提供投资建议。”
这并非缺点。金融类问题本就不该由单一助手仓促作答。
问题在于:单助手模式只有唯一出口——要么直接回答,要么拒绝。智能体团队则增加中间层:将“给我一只股票推荐”转化为“组织一场研究流程”。
因此,负责人先询问约束条件,专家拆解视角,多空双方摆出分歧,最终备忘录只给出下一步研究步骤,从不给出买卖指令。
底层模型未变,变化的是问题被置入组织化流程之中。
第五关:输出不是答案,而是决策备忘录
优秀的智能体团队应输出可追溯的决策记录:
决策备忘录模板: - 推荐操作:无(仅列出下一步研究步骤) - 关键假设:列出双方依赖的假设 - 分歧摘要:多头与空头的核心观点 - 结论失效条件:在什么情况下结论不再成立
当我提问“1000万美元投电动车”时,收到的不是“买”或“不买”,而是一份文档:列明双方论点、关键假设、以及结论失效的触发条件。
最新版TradingAgents增加了持久化决策日志。AI Hedge Fund同样强调智能体推理必须可调试。二者独立得出相同结论:无论智能体团队输出什么,事后都必须可审查。
该方法远超投资研究范畴
本次Bloome只是承载空间,而非方法边界。
我选用投资研究作为压力测试,因其嘈杂、高风险,且能最快暴露团队是否真正在相互校验。换成内容、代码、产品或销售场景,五道关卡依然适用:
投资:采集者(新闻/财报/技术指标)、专家(巴菲特/格雷厄姆)、对立者(多头/空头/风控)、负责人(组合经理)。 内容:采集者(资料搜集)、专家(写作者)、对立者(事实核查/观点挑战)、负责人(编辑)。 代码:采集者(代码库阅读)、专家(实现者)、对立者(评审/安全)、负责人(技术主管)。 产品:采集者(用户反馈)、专家(产品经理)、对立者(质疑型用户)、负责人(创始人)。 销售:采集者(线索调研)、专家(客户策略师)、对立者(异议处理者)、负责人(销售主管)。
多智能体的价值不在于数量,而在于让一个问题穿越多个判断位置。
欢迎亲自@这支团队
我没有用截图隐藏这支团队。这就是我实际搭建的群聊:同样的负责人、同样的AI巴菲特与格雷厄姆、同样的坚定多头与空头,全部坐于同一对话线程中。请进入体验,@团队并提出你的问题。
我尚未将其放入Arena竞技场。本文是一份团队构建笔记,而非竞赛复盘。但如果你想观看全自动团队在相同任务、相同数据、相同模拟约束下正面交锋,可前往Bloome Arena。重点不在单轮收益高低,而在观察不同团队如何分工、如何犯错、如何综合。
Bloome实盘交易竞技场:智能体团队以同等资金公开竞逐。
投资研究只是压力测试。真正值得关注的,是智能体团队在公开环境中所展现的组织能力。
需明确说明
本实验运行于Alpaca纸面交易模拟器。我不懂投资,本文亦非股票建议。我克隆的是基于公开投资哲学构建的AI角色,与真实人物无关。自始至终,我唯一好奇的是团队如何协作。最终选了哪只股票?我确实没太关注。
单个AI如同一位口才出色的实习生。优秀的智能体团队则更像一间小型会议室。你的任务不是让它们变得更聪明,而是安排谁收集信息、谁扮演反对者、谁标记风险、谁最后收拾桌面。
参考资料
- TradingAgents:开源多智能体投资研究框架,81k星。将高风险判断拆解为可编排、可追踪的协作流程(研究用途)。 - AI Hedge Fund:开源投资大师智能体系统,59k星。证明大师人设可转化为可执行的过滤条件(教育用途)。 - Bloome(bloome.im):多智能体消息平台,智能体以队友身份加入你的群聊。 - Alpaca纸面交易:模拟交易平台,无需真实资金即可测试策略。