AI Pulse · 2026 年 7 月 4 日

今日速览三件事，一分钟读完

01未来工作不再拼专业技能，要拼这个？深度观点 · @fchollet
02GLM-5.2优化出的可视化，完全不像开源模型实战经验 · @AliGrids
03开源情报监控中东战事全程免费免API工具产品 · @7h3h4ckv157

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文，经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 140

学术报告不让用ChatGPT提示，这算歧视吗？

有人在2025年的学术报告中被禁止使用ChatGPT，当事人认为这属于歧视，此事引发了讨论。

社区讨论：多人认可当前学术圈日常用AI生成内容再修改的情况已经非常普遍。部分人认为禁止使用ChatGPT不合理，AI本质上和搜索工具能力没有区别，应该接受工具带来的效率提升。也有人反对，指出直接用AI生成内容再修改属于抄袭，允许 prompts 代替研究者本人准备报告，是浪费听众时间，称这项规定为歧视的说法很荒谬。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 259

想本地跑最先进大模型？这份指南火了

不用依赖云端API，按这份指南就能自己在本地跑SOTA大模型，适合不想把数据上传的人参考。

社区讨论：多数本地大模型爱好者坦言，玩本地大模型硬件投入普遍偏高。指南里接近Claude Opus水平的顶配方案预算高达4万美元，实际要达到接近Opus的性能甚至需要40万美元，算下来比长期订阅GPT、Claude这类API服务贵得多。有人推荐性价比方案：3000美元可买带48GB内存的M系列Mac，或是单块RTX 3090就能运行Qwen3.6-27B的q4量化版本，也有人好奇介于入门和顶配之间的96GB VRAM千元方案的实际表现。

在 HN 看讨论 ↗ 原文 / 论文 ↗

行业动态 · Hacker News▲ 62

谷歌AI编程助手Gemini Code Assist 7月17日要关停

依赖这个AI编程工具的开发者，得提前找好替代方案了

社区讨论：多名用户纠正原标题错误，本次仅关停GitHub上面向非企业用户的免费版Gemini Code Assist，并非全线停服，普遍吐槽谷歌产品命名混乱，不同版本名称相近、频繁更名，文档信息杂乱。不少用户借此提醒，要保持AI工作流可迁移，评估工具时需把工具消失后的迁移成本和功能放在同等权重考量，还有用户调侃谷歌产品管理能力差，调侃这次停服又可以更新谷歌埋葬品名单killedbygoogle.com了。

在 HN 看讨论 ↗ 原文 / 论文 ↗

前沿研究 · @omarsar0▲ 5.5K

旧论文思路改一改，居然干翻了全注意力

线性注意力为了省内存会丢失长信息，新方法HOLA加了一小块不压缩的精确缓存，参数更少效果反而比全注意力更好。

这篇新论文值得一读，建议收藏。基本思路是将压缩循环状态与小型精确记忆配对，在保留线性注意力效率的同时，实现长范围召回。下文是更多介绍：

线性注意力和状态空间模型会将整个前缀压缩成固定大小的状态。这样就能获得O(1)内存复杂度，但当大量键值关联相互竞争时，更早的信息会被覆盖，“针查找”性能会下降。

HOLA为线性注意力补充了类似海马体的结构。它保留常规delta规则状态作为压缩记忆，额外添加了一个有界精确KV缓存，构成半参数测试时记忆。

状态负责建模可线性压缩的结构，缓存则存储不应通过压缩处理的关联。缓存写入时不需要学习淘汰模块，只保留预测残差实际提交给状态的token。

在15B SlimPajama token上训练，340M参数的HOLA将Wikitext困惑度从27.32降至22.92，优于全注意力Transformer++的26.88，并且在长达32k token的RULER针查找任务中保持鲁棒，这是它训练长度的16倍。

论文地址：

来我们的学院学习如何构建有效的AI agent：

🔥 信号雷达

学术报告不让用ChatGPT提示，这算歧视吗？

想本地跑最先进大模型？这份指南火了

谷歌AI编程助手Gemini Code Assist 7月17日要关停

旧论文思路改一改，居然干翻了全注意力

开源情报监控中东战事 全程免费免API

GLM-5.2优化出的可视化，完全不像开源模型

未来工作不再拼专业技能，要拼这个？

业内人士称GPT-5.6或将成为OpenAI的重大胜利

Leanstral 1.5大模型发布 多项推理 benchmark达SOTA

用户征集性能优于GLM 5.2的开源大模型

GLM-5.2现已上线NVIDIA NIM并提供免费端点

Fable 5大模型正式上线Framer设计平台

大企业AI投入这么多，居然开始不让员工用外部工具了

现在顶级软件工程师，每月AI预算开到800美元了

AI公司偷偷在输出文字里加了追踪你的水印

OpenAI现在分三个产品，有人说完全没必要合并成一个就好

AI取代分析师的担心刚消，token钱谁付又成了新问题

用好AI提示的小技巧：先问「做什么」，再问「怎么做」

好多聪明人，居然都不会用AI编码代理

现在有人训练大模型，要它必须有独特观点

遇到AI硬编码安全规则，就知道离AGI还有多远

企业用AI很快就要自己部署了？

万亿token规模智能体推理，官方公开完整幻灯片

开发者分享大模型使用习惯从最强模型转向小模型

当前存在两种互相矛盾的AI发展叙事

可通过Claude Code实现完全免费开源的AI视频剪辑

教你使用纯Markdown文件构建复利知识库

开发者称已完全迁移至开源模型日常使用GLM 5.2

业内观点：当前前沿AI缺少高目标野心实践

大企业AI投入这么多，居然开始不让员工用外部工具了

现在顶级软件工程师，每月AI预算开到800美元了

AI公司偷偷在输出文字里加了追踪你的水印

OpenAI现在分三个产品，有人说完全没必要合并成一个就好

AI取代分析师的担心刚消，token钱谁付又成了新问题

用好AI提示的小技巧：先问「做什么」，再问「怎么做」

好多聪明人，居然都不会用AI编码代理

谷歌AI编程助手Gemini Code Assist 7月17日要关停

想本地跑最先进大模型？这份指南火了

学术报告不让用ChatGPT提示，这算歧视吗？

未来工作不再拼专业技能，要拼这个？

企业用AI很快就要自己部署了？

遇到AI硬编码安全规则，就知道离AGI还有多远

现在有人训练大模型，要它必须有独特观点

旧论文思路改一改，居然干翻了全注意力

万亿token规模智能体推理，官方公开完整幻灯片

开源情报监控中东战事 全程免费免API

GLM-5.2优化出的可视化，完全不像开源模型

业内观点：当前前沿AI缺少高目标野心实践

Fable 5大模型正式上线Framer设计平台

开发者称已完全迁移至开源模型日常使用GLM 5.2

GLM-5.2现已上线NVIDIA NIM并提供免费端点

用户征集性能优于GLM 5.2的开源大模型

Leanstral 1.5大模型发布 多项推理 benchmark达SOTA

教你使用纯Markdown文件构建复利知识库

业内人士称GPT-5.6或将成为OpenAI的重大胜利

可通过Claude Code实现完全免费开源的AI视频剪辑

当前存在两种互相矛盾的AI发展叙事

开发者分享大模型使用习惯从最强模型转向小模型

📬 订阅 AI Pulse

开源情报监控中东战事全程免费免API

Leanstral 1.5大模型发布多项推理 benchmark达SOTA

开源情报监控中东战事全程免费免API

Leanstral 1.5大模型发布多项推理 benchmark达SOTA