一个开源模型，现在能真正读懂你乱拍的PDF和手写公式

📅 2026 年 4 月 13 日 📖 约 1 分钟 @HowToAI_ on 𝕏 AI开源工程

有人扔出个17亿参数的开源模型，连手机拍歪的PDF、微信转来的Excel截图、带手写批注的LaTeX照片都能一口吞下。管你斯瓦希里语发票还是蒙古文会议纪要，它照单全收。

以前说“处理PDF”，不过是把字抠出来；现在这个模型说“解析PDF”，是真能把表格对齐、公式语义还原、多语言单元格理清楚。过去得串起OCR、翻译、表格识别、数学解析四套工具，像在街边小馆点菜还得自己跑后厨配调料。现在一个模型端到端干完。

代码和训练数据全放GitHub，没API墙，不绑云服务，README里连RTX 3060笔记本怎么跑都写明白了。图标还蛮朴素的，但能用。

中小企业法务、自由译者、研究生不用等大厂施舍适配包，自己就能塞进日常文档流。有人刚把它接进Notion插件，试把手写批注PDF转成带版本对比的Markdown笔记。我原以为这种事还得等两年，结果人家已经跑起来了。

它没吹‘取代律师’或‘终结翻译’，牛皮没吹爆。这条路的终点未必是通用智能，但起点已经变了——不再是‘能不能做’，而是‘你手头有没有一份需要被真正读懂的文件’。