你刚更新的网页，AI可能根本看不见

📅 2026 年 4 月 10 日 📖 约 1 分钟 @simonw on 𝕏 AI搜索基础设施

有人刚更新公司官网的技术文档，三天后问 Claude“支持哪些协议”，得到的答案仍是旧版。问题不在模型记性差，而在它背后的搜索引擎还没抓取新页面。

OpenAI、Anthropic 和 Meta 的聊天工具都带搜索功能，但没人说清楚：它们到底用哪家搜索引擎的索引？Anthropic 曾在文档里提过用 Brave 搜索，后来悄悄删掉了。所谓“实时搜索”，常常只是查一个固定快照——而这个快照什么时候生成、覆盖哪些网站、包不包含你的域名，统统没有公开。

网站所有者没法判断内容会不会被收录，不知道该向谁提交 sitemap，也猜不出信息多久才会上线。用户可以去查 AI 工具的 robots.txt 文件，看看它自称是谁家的爬虫。但这需要技术门槛，结果还不一定靠谱。

当一家公司把“用什么搜索引擎”当成秘密，它藏起来的不只是技术选型。更是谁有权决定哪些内容能被看见。

📎 阅读原文 · @simonw on 𝕏