你刚更新的网页,AI可能根本看不见
有人刚更新公司官网的技术文档,三天后问 Claude“支持哪些协议”,得到的答案仍是旧版。问题不在模型记性差,而在它背后的搜索引擎还没抓取新页面。
OpenAI、Anthropic 和 Meta 的聊天工具都带搜索功能,但没人说清楚:它们到底用哪家搜索引擎的索引?Anthropic 曾在文档里提过用 Brave 搜索,后来悄悄删掉了。所谓“实时搜索”,常常只是查一个固定快照——而这个快照什么时候生成、覆盖哪些网站、包不包含你的域名,统统没有公开。
网站所有者没法判断内容会不会被收录,不知道该向谁提交 sitemap,也猜不出信息多久才会上线。用户可以去查 AI 工具的 robots.txt 文件,看看它自称是谁家的爬虫。但这需要技术门槛,结果还不一定靠谱。
当一家公司把“用什么搜索引擎”当成秘密,它藏起来的不只是技术选型。更是谁有权决定哪些内容能被看见。