AI Pulse · 2026 年 6 月 30 日

今日焦点

本地AI知识库：断网也能用，8GB内存就能跑

如果你在意隐私，或者想在没有网络的环境下使用自己的文档，一套完全运行在本地的知识库是可行的方案。它的核心是检索增强生成（RAG）技术——不是把文档喂给模型训练，而是在每次提问时，系统从你的文档中检索相关片段，再交给模型回答。

这套系统由四个组件构成。Ollama负责在电脑上运行大模型，Open WebUI提供聊天界面和知识库管理，向量模型把文档片段转换成数字向量，向量数据库则保存这些向量并在提问时找出相关内容。真正的工作流程是：文档 → 提取文字 → 切成小块 → 生成向量 → 检索相关片段 → 交给模型回答。

Open WebUI的Knowledge功能支持两种模式。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

工具 · @RoundtableSpace▲ 3.4万

开源AI现在能自动把票据PDF整理成报税数据

小企业会计贴票整理报税表的重复工作，可以直接交给这个开源工具处理，不用再买付费的财务AI工具。

开源 AI 现已可将收据、发票和 PDF 转换为符合税务要求的数据

本地AI知识库：断网也能用，8GB内存就能跑

🔥 信号雷达

开源AI现在能自动把票据PDF整理成报税数据

研究者对比分析开源闭源大模型复杂任务表现

别把错误日志直接粘贴进 Claude Code

开发者levelsio指出界面正转向即时生成临时界面

DeepSeek V4 调整了峰谷定价，大模型降价了？

Anthropic CEO称开源AI正在变得越来越危险

通义千问3.6 27B被评为本地开发最优选择

能自己搭框架的自主编码大模型发布了

开源自主编码模型，居然能自己迭代优化

马斯克的Grok 4.5现在已经内部测性能了

机器人看一眼自己动一动，就能适应新环境

视频编辑实时化：逐帧改，背景不崩

跨Claude和ChatGPT的统一记忆存储协议发布

卖AI服务居然这么简单？搞定一个重复问题就行

美团开源了1.6万亿参数的LongCat-2.0大模型

AI帮写代码后，半年里新发手游数量翻了一倍

两党都同意的AI投资计划，被骂成了坏主意

原来InstructGPT训练时用了这么多模型

现有学习率缩放规律可能算错最优值了

美团放出LongCat-2.0，不用GPU训练大模型

找工作不需要LinkedIn？个人网站更管用

Google DeepMind搬去伦敦新办公室啦

用AI投了1150份简历，只收到1个回复

正在搭全自动智能研究新平台，找反馈和伙伴

中国AI基础设施压力降了，新项目要爆火

这项工程优化把延迟降到几乎可以忽略

加密交易所OKX希望AI智能体互相雇佣付费

转出来的AI！每生成一个字都得手摇

大公司开始用国产开源轻量模型代替顶级模型

新蒸馏方法OPD可合并多个教师模型

国产外卖平台训出1.6T大模型，接近顶级水平

AI代理编辑工具更新，稳定性和灵活性大幅提升

科技博主骂太空数据中心全是蠢主意，急了还骂观众

5.2GiB开源大模型，想在低配迷你电脑上跑

Claude用人类代码训练我，我也在训练它

外卖平台训练大模型？参数规模达到1.6T

开源大模型变强了，现在战场换到这边来了

AI代理能自动刷新闻写内容钩子

开发者非专业领域参赛获第十二名 推理 latency达1.8ms

AI Engineer创始人@swyx接受播客专访透露重大里程碑

Claude Code创作者分享全新原生AI产品团队图谱

你听说吗？字节跳动能一键生成4K30秒短片了

LlamaIndex推出了同时支持两种搜索的检索工具

AI智能体现在支持程序自动创建子智能体了

有CEO说量子计算能把AI训练提速好几个量级

有人吐槽Anthropic是对开源最不友好的公司

多家顶流开源 coding 模型打包包月，刚好撞上闭源模型收紧权限

不用GPU，5万颗中国ASIC跑出一流大模型

美团预训练大模型，用了五万多颗AI ASIC

AI代理不再事后打分，边聊边修正方向

检测AI智能体错误，成本只要闭源模型的1%

一站式用多个开源大模型，不用再管理一堆API密钥

Google AI Studio 新增功能，分享应用可带完整对话

用最土办法实现了多个AI一起协作干活

把LangGraph智能体转成语音智能体，现在超简单

Cursor AI推出远程开发+iOS新功能 需手动开启

开发者Omar分享实测有效的人物搜索工具CLODOAI

AI编码开始改变开发习惯 项目瞄准AI原生Web3开发

分享普通人研究美股的标准化流程工具

M5 Max MacBook Pro对比NVIDIA DGX Spark本地AI运行

马斯克要求优化Grok中各细小AI性能瓶颈

35B模型靠“想得更远”打败万亿参数

AI学技能不再靠外挂，自己复盘就能变强

AI写代码：验证比生成更难

让AI视频不穿帮：物理一致性训练

把图像压缩成文字一样的代码，还能不丢细节

大模型的「思考」其实没你想的那么深

AI 终端助手评测：最强模型仅及格

教机器人学人干活，关键在“翻译”动作

AI 智能体该何时停手？

AI推理提速10倍：新方法打破猜测解码天花板

AI 世界模型：只会“常见”，一遇“反常”就崩

AI操作电脑：点鼠标不如写代码？

AI画画也能用RL调教，效果肉眼可见

AI规划提速：一次预测整条路径

机器人界的GPT时刻？对齐异构数据实现泛化

AI看视频只会认物体，不会推理逻辑

一个模型搞定所有导航任务，还能现场切换模式

开发者非专业领域参赛获第十二名推理 latency达1.8ms

Cursor AI推出远程开发+iOS新功能需手动开启

AI编码开始改变开发习惯项目瞄准AI原生Web3开发