AI Pulse

它不再只读一遍文档,而是像人一样反复核对直到结果对得上

它不再只读一遍文档,而是像人一样反复核对直到结果对得上

财务团队刚收到一份200页的基金持仓报表,需要把每一页上的证券代码、成本、浮盈浮亏全部填进系统。过去的做法是:跑一次AI提取,再派两个人花三天逐行核对,发现漏了47个条目,改完又漏了12个。

Deep Extract不这么做。它先提取,再拿着结果回原文里找依据;发现某行金额没对应上原始数字,就标记为‘待重提’,调用子代理专攻这一块;反复循环,直到每个字段都能在原文中定位到确切位置,并满足预设逻辑(比如‘所有行项目之和必须等于总金额’)。 这意味着:以前靠人力兜底的环节,现在由AI自己闭环完成。

它已在生产环境中处理过2800万字段,最长文档达2500页。对关键文档,字段准确率稳定在99–100%,甚至超过人工标注专家。 这意味着:不是‘更接近人工水平’,而是‘在特定任务上,人成了它的校验基准’。

客户反馈最集中的痛点,不是模型看不懂字,而是单次推理像赶工期——面对上千行发票明细,模型会跳行、合并、省略,尤其当需要标注出处时,错误率陡增。 这意味着:问题不在理解力,而在缺乏‘责任机制’;没有自我验证,就没有持续准确。

启用‘引用定位’后,每个提取字段都附带原文中的像素级坐标框。审计人员点一下就能跳转到PDF里那一行那一列。 这意味着:合规不再依赖‘我相信这个结果’,而变成‘我能立刻验证这个结果’。

真正值得注意的是:它没有追求更快,而是把‘一次跑对’这件事重新定义为可配置、可验证、可追溯的过程——准确率不再是黑箱输出,而是由用户用自然语言写的规则来定义什么是‘对’。

现在的问题不再是‘能不能提出来’,而是‘你打算让AI为哪条逻辑负责’。

📎 阅读原文 · Reducto