AI Pulse

一个开源模型,现在能真正读懂你乱拍的PDF和手写公式

有人扔出个17亿参数的开源模型,连手机拍歪的PDF、微信转来的Excel截图、带手写批注的LaTeX照片都能一口吞下。管你斯瓦希里语发票还是蒙古文会议纪要,它照单全收。

以前说“处理PDF”,不过是把字抠出来;现在这个模型说“解析PDF”,是真能把表格对齐、公式语义还原、多语言单元格理清楚。过去得串起OCR、翻译、表格识别、数学解析四套工具,像在街边小馆点菜还得自己跑后厨配调料。现在一个模型端到端干完。

代码和训练数据全放GitHub,没API墙,不绑云服务,README里连RTX 3060笔记本怎么跑都写明白了。图标还蛮朴素的,但能用。

中小企业法务、自由译者、研究生不用等大厂施舍适配包,自己就能塞进日常文档流。有人刚把它接进Notion插件,试把手写批注PDF转成带版本对比的Markdown笔记。我原以为这种事还得等两年,结果人家已经跑起来了。

它没吹‘取代律师’或‘终结翻译’,牛皮没吹爆。这条路的终点未必是通用智能,但起点已经变了——不再是‘能不能做’,而是‘你手头有没有一份需要被真正读懂的文件’。

📎 阅读原文 · @HowToAI_ on 𝕏