只用现有Claude订阅,就能搭本地知识图谱
你只需依靠你的 Claude Code/Codex 订阅,无需任何基础设施,就能搭建一个用于数据分析的本地知识图谱引擎,方法如下:
1. 最重要的一步是定义你的本体和数据模型
2. 创建一个 Claude 子代理(使用 Sonnet)来提取实体和关系
3. 将你的数据存储在 Ladybug 中,这是一个支持 Cypher 的本地图数据库,同时将数据存储在 parquet 文件中
4. 开放一个读写脚本/工具,定义 Claude 如何与 Ladybug 交互
5. 再编写一个 Claude 子代理(使用 Haiku)来完成归一化步骤
6. 要添加时间维度,你可以将新条目写入仅追加日志,仅在查询时物化知识图谱的一部分。
然后你就完成了。提取、归一化和查询全部通过 Claude 加少量 Python 代码完成。
这里最消耗资源的步骤是归一化,我们需要将每个新实体与已有实体进行比对。要解决这个问题,你可以:
- 一次只摄入少量文档
- 保持你的本体非常紧凑
- 通过文本+语义搜索(本地运行)找到高置信度匹配结果,仅对异常值使用 Claude Code
这作为本地数据分析工具效果非常好,几乎没有基础设施成本(仅需要你支付代理订阅费用)。
本文由 AI 翻译自英文原帖,技术名词保留英文。
查看 X 原帖