有人每半年重画一次AI技术栈地图,不是为了更新而是为了清零
我将开启一个新系列。每六个月,我会从头重绘一次 AI 技术栈,并在此发布地图。时间为五月和十一月,绝不跳期。这是第一版。共 10 层,2 条垂直轨道。这张地图上有一半内容在 18 个月前还不存在。
𝗧𝗵𝗲 𝟭𝟬 𝗹𝗮𝘆𝗲𝗿𝘀(自上而下)→
终端用户界面:Cursor、Perplexity、垂直领域智能体
智能体运行时:Claude Code、Devin、Replit Agent、Cursor Agent
编排层:LangGraph、Microsoft Agent Framework、Pydantic AI、Mastra、Google ADK
协议层:用于工具的 MCP、用于智能体的 A2A、用于流式传输的 AG-UI
记忆层:Mem0、Letta、Zep
检索层:重排序器(rerankers)、混合搜索、GraphRAG
存储层:pgvector、Qdrant、Turbopuffer、Pinecone
模型网关:Portkey、LiteLLM、OpenRouter
基础模型:Claude、GPT、Gemini、Llama、DeepSeek、Qwen
推理与计算:Together、Fireworks、vLLM、Blackwell、MI400、TPU、Trainium、Groq
但各层本身并非最有趣的部分。真正有趣的是横向贯穿的内容。
𝗧𝗵𝗲 𝟮 𝗿𝗮𝗶𝗹𝘀
可观测性与治理已不再是“层”,而是两条垂直轨道。它们穿透技术栈的每一层。你无法将其堆叠在顶部或底部,因为它们触及一切:每一次提示、每一次工具调用、每一次检索、每一次模型响应。这是 2024 年绝大多数架构图犯下的错误。
𝗪𝗵𝗮𝘁 𝗰𝗵𝗮𝗻𝗴𝗲𝗱 𝘀𝗶𝗻𝗰𝗲 𝟮𝟬𝟮𝟰
记忆已成为独立一层——两年前的地图上尚无此层。
MCP 取代了定制化集成。几乎所有主流框架如今均已内置该协议。
向量数据库被整合进 PostgreSQL。pgvector 已成为大多数团队的默认选择。
框架开始整合:AutoGen 已并入 Microsoft Agent Framework;今年还将有更多类似整合发生。
可观测性已从第 100 天提前至第 1 天。到 2026 年,若未配备追踪(traces)、评估(evals)及两次运行对比能力,你将无法上线任何智能体。
𝗧𝗵𝗲 𝗽𝗮𝘁𝘁𝗲𝗿𝗻 𝘁𝗼 𝘄𝗮𝘁𝗰𝗵
技术栈并未变得更高,而是中间变薄、边缘变厚。中间正围绕协议快速收敛;而真正的开发重心已移至边缘——即智能体与用户交互之处,以及智能体与数据交互之处。如果你的架构图中间仍仅用一个标着 “LangChain” 的方框表示,那么现在就该重绘了。
十一月见,届时发布第二版。
你认为到 2026 年底,框架层、记忆层、可观测性层中,哪一个会最快完成整合?
♻️ 转发此帖,让你的社交网络获得不公平优势。
📌 若需本指南高清 PDF 版:
1. 关注 @coder_surya
2. 保存此帖
3. 转发至你的社交网络
4. 加入我的 AI 社区:……
本文由 AI 翻译自英文原帖,技术名词保留英文。
查看 X 原帖