社区讨论:多人认可当前学术圈日常用AI生成内容再修改的情况已经非常普遍。部分人认为禁止使用ChatGPT不合理,AI本质上和搜索工具能力没有区别,应该接受工具带来的效率提升。也有人反对,指出直接用AI生成内容再修改属于抄袭,允许 prompts 代替研究者本人准备报告,是浪费听众时间,称这项规定为歧视的说法很荒谬。
🔥 信号雷达
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌
行业动态 · Hacker News▲ 140
学术报告不让用ChatGPT提示,这算歧视吗?
有人在2025年的学术报告中被禁止使用ChatGPT,当事人认为这属于歧视,此事引发了讨论。
学术报告不让用ChatGPT提示,这算歧视吗?
有人在2025年的学术报告中被禁止使用ChatGPT,当事人认为这属于歧视,此事引发了讨论。
行业动态 · Hacker News▲ 259
想本地跑最先进大模型?这份指南火了
不用依赖云端API,按这份指南就能自己在本地跑SOTA大模型,适合不想把数据上传的人参考。
想本地跑最先进大模型?这份指南火了
不用依赖云端API,按这份指南就能自己在本地跑SOTA大模型,适合不想把数据上传的人参考。
社区讨论:多数本地大模型爱好者坦言,玩本地大模型硬件投入普遍偏高。指南里接近Claude Opus水平的顶配方案预算高达4万美元,实际要达到接近Opus的性能甚至需要40万美元,算下来比长期订阅GPT、Claude这类API服务贵得多。有人推荐性价比方案:3000美元可买带48GB内存的M系列Mac,或是单块RTX 3090就能运行Qwen3.6-27B的q4量化版本,也有人好奇介于入门和顶配之间的96GB VRAM千元方案的实际表现。
行业动态 · Hacker News▲ 62
谷歌AI编程助手Gemini Code Assist 7月17日要关停
依赖这个AI编程工具的开发者,得提前找好替代方案了
谷歌AI编程助手Gemini Code Assist 7月17日要关停
依赖这个AI编程工具的开发者,得提前找好替代方案了
社区讨论:多名用户纠正原标题错误,本次仅关停GitHub上面向非企业用户的免费版Gemini Code Assist,并非全线停服,普遍吐槽谷歌产品命名混乱,不同版本名称相近、频繁更名,文档信息杂乱。不少用户借此提醒,要保持AI工作流可迁移,评估工具时需把工具消失后的迁移成本和功能放在同等权重考量,还有用户调侃谷歌产品管理能力差,调侃这次停服又可以更新谷歌埋葬品名单killedbygoogle.com了。
前沿研究 · @omarsar0▲ 5.5K
旧论文思路改一改,居然干翻了全注意力
线性注意力为了省内存会丢失长信息,新方法HOLA加了一小块不压缩的精确缓存,参数更少效果反而比全注意力更好。
旧论文思路改一改,居然干翻了全注意力
线性注意力为了省内存会丢失长信息,新方法HOLA加了一小块不压缩的精确缓存,参数更少效果反而比全注意力更好。
这篇新论文值得一读,建议收藏。基本思路是将压缩循环状态与小型精确记忆配对,在保留线性注意力效率的同时,实现长范围召回。下文是更多介绍:
线性注意力和状态空间模型会将整个前缀压缩成固定大小的状态。这样就能获得O(1)内存复杂度,但当大量键值关联相互竞争时,更早的信息会被覆盖,“针查找”性能会下降。
HOLA为线性注意力补充了类似海马体的结构。它保留常规delta规则状态作为压缩记忆,额外添加了一个有界精确KV缓存,构成半参数测试时记忆。
状态负责建模可线性压缩的结构,缓存则存储不应通过压缩处理的关联。缓存写入时不需要学习淘汰模块,只保留预测残差实际提交给状态的token。
在15B SlimPajama token上训练,340M参数的HOLA将Wikitext困惑度从27.32降至22.92,优于全注意力Transformer++的26.88,并且在长达32k token的RULER针查找任务中保持鲁棒,这是它训练长度的16倍。
论文地址:
来我们的学院学习如何构建有效的AI agent:
工具产品 · @7h3h4ckv157▲ 5.9K
开源情报监控中东战事 全程免费免API
整合了五十多个公开信息源,把新闻、社交、军事、金融数据整理在同一个实时看板里,完全免费,运行不需要API密钥
开源情报监控中东战事 全程免费免API
整合了五十多个公开信息源,把新闻、社交、军事、金融数据整理在同一个实时看板里,完全免费,运行不需要API密钥
用于监控中东冲突的实时开源情报(OSINT)指挥中心。
它聚合了来自50余个来源的开源情报:新闻、Telegram、军事追踪、金融市场,整合到同一个实时仪表板中。
无需API密钥。完全免费运行。
来源:
实战经验 · @AliGrids▲ 1.4万
GLM-5.2优化出的可视化,完全不像开源模型
有人用GLM-5.2优化出了漂亮的可视化效果,体验完全不像开源模型能做到的程度,可以关注开源大模型的实际能力提升
GLM-5.2优化出的可视化,完全不像开源模型
有人用GLM-5.2优化出了漂亮的可视化效果,体验完全不像开源模型能做到的程度,可以关注开源大模型的实际能力提升
深度观点 · @fchollet▲ 1.1万
未来工作不再拼专业技能,要拼这个?
未来找工作,需要的是高适应力与创造力,核心是解决复杂问题,不再是重复执行或者单一专业技能
未来工作不再拼专业技能,要拼这个?
未来找工作,需要的是高适应力与创造力,核心是解决复杂问题,不再是重复执行或者单一专业技能
大模型 · @omarsar0▲ 8.1K
业内人士称GPT-5.6或将成为OpenAI的重大胜利
业内观点认为GPT-5.6是前沿模型的决定性时刻,需重视用户体验
业内人士称GPT-5.6或将成为OpenAI的重大胜利
业内观点认为GPT-5.6是前沿模型的决定性时刻,需重视用户体验
我相信 GPT-5.6 会是 OpenAI 的一场巨大胜利。这会是前沿模型的决定性时刻。
但他们需要仔细打磨用户体验。
在我看来,Fable 5 重新发布就是因为这个原因搞砸了。
我并不完全反对护栏机制,但把这件事做对非常重要。
开源 · @AlbertQJiang▲ 1.9万
Leanstral 1.5大模型发布 多项推理 benchmark达SOTA
6B参数开源大模型Leanstral 1.5正式发布,多项测评达最优
Leanstral 1.5大模型发布 多项推理 benchmark达SOTA
6B参数开源大模型Leanstral 1.5正式发布,多项测评达最优
Leanstral 1.5 已发布。它在 FATE-H/X 上达到当前最优水平,在 PutnamBench 上得分为 587,在 miniF2F 上达到饱和,所有这些都来自一个采用 Apache-2 许可证、拥有 6B 激活参数的模型。
我们现在正愉快地验证代码属性,在 Rust 代码仓库中排查错误!
涵盖训练环境和评估结果的技术报告已发布。我们同时开源了 LeanstralSafeVerify 和 FLTEval。
大模型 · @Im_IrushiK▲ 7.7K
用户征集性能优于GLM 5.2的开源大模型
社交平台用户发起征集,寻找比GLM 5.2更好的开源模型
用户征集性能优于GLM 5.2的开源大模型
社交平台用户发起征集,寻找比GLM 5.2更好的开源模型
大模型 · @yuhasbeentaken▲ 1.7万
GLM-5.2现已上线NVIDIA NIM并提供免费端点
GLM-5.2上线NVIDIA NIM,速度免费优势明显但模型质量较低
GLM-5.2现已上线NVIDIA NIM并提供免费端点
GLM-5.2上线NVIDIA NIM,速度免费优势明显但模型质量较低
GLM-5.2 现已通过 NVIDIA NIM 开放,提供免费端点。
优势:模型速度快,完全免费。
缺点:NVIDIA 似乎使用的是量化版本,生成质量低于官方 API。
我们正在开发 @OffloopHQ ,让智能体与人类能在 workspace 中协作!
产品发布 · @framer▲ 1.3万
Fable 5大模型正式上线Framer设计平台
Fable 5性能优于Opus 4.8,更适配各类设计工作
Fable 5大模型正式上线Framer设计平台
Fable 5性能优于Opus 4.8,更适配各类设计工作
Fable 5 现已登陆 Framer。
它是我们测试过的最具主动性的模型,常常能超出任务要求,产出风格更鲜明、可复用元素更丰富、首轮结果更精致的作品。
它尤其擅长原创设计工作、着色器和细腻动效。
在我们的评估中,Fable 5 总分为 83%,领先于得分为 77% 的 Opus 4.8,并且在设计分项以 81% 的得分领跑所有模型。它消耗的 credits 是 GPT 5.5 的 2 倍。
在 Framer 中了解更多关于 Fable 的信息:
商业 · @theinformation▲ 1.2K
大企业AI投入这么多,居然开始不让员工用外部工具了
Meta每年花数十亿美元做AI,现在要求员工减少使用外部 coding 辅助工具,优先用自家开发的工具
大企业AI投入这么多,居然开始不让员工用外部工具了
Meta每年花数十亿美元做AI,现在要求员工减少使用外部 coding 辅助工具,优先用自家开发的工具
职场 · @rohanpaul_ai▲ 872
现在顶级软件工程师,每月AI预算开到800美元了
这是特斯拉给工程师开出的新AI投入标准,这些工程师的工作已经接近物理机器和代码的极限
现在顶级软件工程师,每月AI预算开到800美元了
这是特斯拉给工程师开出的新AI投入标准,这些工程师的工作已经接近物理机器和代码的极限
针对软件工程师的全新AI预算基准可能已经定在了每月800美元。
这是特斯拉最新的AI支出标准。
考虑到这些工程师的工作已经接近物理机器与代码能力的极限,这个数字应该会成为各地软件AI预算的锚点。
隐私 · @BrianRoemmele▲ 1.5K
AI公司偷偷在输出文字里加了追踪你的水印
两家AI公司已经给大段输出文字加上了文本水印,部分水印还带能定位到个人的序列号
AI公司偷偷在输出文字里加了追踪你的水印
两家AI公司已经给大段输出文字加上了文本水印,部分水印还带能定位到个人的序列号
⚠️ 警告⚠️ 两家AI公司升级了它们用于大多数段落长度及更长文本输出的文本水印技术!
甚至在一些简单文本输出里,都藏着可追踪到你个人的序列号。
我的独家研究,你在其他任何地方都找不到。我会向你展示如何找到它并移除它。这是件大事。
独家文章即将推出。
产品 · @petergyang▲ 1.7K
OpenAI现在分三个产品,有人说完全没必要合并成一个就好
观点认为如果OpenAI做一个统一应用,把ChatGPT和Codex整合进去,还能保持易用,当前的产品拆分问题会更明显
OpenAI现在分三个产品,有人说完全没必要合并成一个就好
观点认为如果OpenAI做一个统一应用,把ChatGPT和Codex整合进去,还能保持易用,当前的产品拆分问题会更明显
💯 我真的不明白为什么非得做成三个独立的产品。
如果 OpenAI 能成功设计出一个统一应用,把 ChatGPT 整合进 Codex,同时保持直观易用——那现在这个拆分的问题就会更刺眼了。
商业 · @theinformation▲ 1.4K
AI取代分析师的担心刚消,token钱谁付又成了新问题
金融数据公司已经打消了AI抢饭碗的担忧,但投资者现在开始问:AI代理消耗的数据量远超过人类分析师,token费用到底谁来出
AI取代分析师的担心刚消,token钱谁付又成了新问题
金融数据公司已经打消了AI抢饭碗的担忧,但投资者现在开始问:AI代理消耗的数据量远超过人类分析师,token费用到底谁来出
技巧 · @louszbd▲ 115
用好AI提示的小技巧:先问「做什么」,再问「怎么做」
想要榨干模型的全部能力,先问方向再问方法,别让模型被你自己已有的认知限制住
用好AI提示的小技巧:先问「做什么」,再问「怎么做」
想要榨干模型的全部能力,先问方向再问方法,别让模型被你自己已有的认知限制住
真希望Thariq能更频繁地发内容。
我关于做规划的小技巧是:如果你想要从模型那里获得最大价值,先问「是什么」,再问「怎么做」。
这样一来,模型就不会被你已知的信息限制住,能发挥出它的最佳水平。
观点 · @jpschroeder▲ 156
好多聪明人,居然都不会用AI编码代理
这个判断针对2026年的行业状态,哪怕是高智商从业者,也未必能用好这类AI工具
好多聪明人,居然都不会用AI编码代理
这个判断针对2026年的行业状态,哪怕是高智商从业者,也未必能用好这类AI工具
深度观点 · @chaykak▲ 611
现在有人训练大模型,要它必须有独特观点
现在行业都在要求大模型输出通用中立内容,有人反其道而行之,主动要求大模型给出鲜明独特的观点。
现在有人训练大模型,要它必须有独特观点
现在行业都在要求大模型输出通用中立内容,有人反其道而行之,主动要求大模型给出鲜明独特的观点。
深度观点 · @Dan_Jeffries1▲ 516
遇到AI硬编码安全规则,就知道离AGI还有多远
处理日常任务时,模型还需要笨拙生硬、范围过大的硬编码安全规则,无法实时自我防护,这能帮判断我们离AGI还有多远。
遇到AI硬编码安全规则,就知道离AGI还有多远
处理日常任务时,模型还需要笨拙生硬、范围过大的硬编码安全规则,无法实时自我防护,这能帮判断我们离AGI还有多远。
当你在做一件日常小事时碰到一条愚蠢、生硬、范围过度宽泛的硬编码安全启发式规则,你就会完全清楚我们离 AGI 还有多远。
如果这些模型真的那么聪明,它们就能实时自我防护,根本不需要单独的分类器。
深度观点 · @victormustar▲ 1.3K
企业用AI很快就要自己部署了?
这一观点会改变企业AI投入的方向,值得留意
企业用AI很快就要自己部署了?
这一观点会改变企业AI投入的方向,值得留意
新品发布 · @togethercompute▲ 2.2K
万亿token规模智能体推理,官方公开完整幻灯片
想学习大公司如何搭建万亿token生产规模的智能体推理引擎,可以直接下载官方放出的完整深入讲解幻灯片
万亿token规模智能体推理,官方公开完整幻灯片
想学习大公司如何搭建万亿token生产规模的智能体推理引擎,可以直接下载官方放出的完整深入讲解幻灯片
我们将发布我们在 AI Engineer World's Fair 进行的 2 小时深度探究环节的完整演示幻灯片。
我们在环节中介绍了我们如何构建推理引擎,以在万亿 token 生产规模下为智能体工作负载提供服务。
幻灯片 ⬇️
大模型 · @nicdunz▲ 264
开发者分享大模型使用习惯从最强模型转向小模型
小模型性能提升后,开发者默认用小模型仅在需要时切大模型,讨论自动路由可行性
开发者分享大模型使用习惯从最强模型转向小模型
小模型性能提升后,开发者默认用小模型仅在需要时切大模型,讨论自动路由可行性
此前我做任何任务都会默认选用性能最强的大模型,因为小型大模型一直能力太差。
如今小型大模型的实际性能已经相当出色,我开始更享受默认使用小模型的状态。
小模型运行速度更快,我只在有需要的时候才切换到性能最强的大模型。
我好奇自动路由是不是推出得太早了。
自动路由刚出现的时候,小模型确实速度快,但能力仍然不足,这可能是当时没人接受它的原因。
现在自动路由或许真的是正确方向,因为哪怕用小模型,一半的任务都能搞定,不需要切换。
观点 · @HamelHusain▲ 631
当前存在两种互相矛盾的AI发展叙事
HamelHusain在𝕏提出两种同时存在的AI观点,两种观点互不一致,他本人更偏向第一种
当前存在两种互相矛盾的AI发展叙事
HamelHusain在𝕏提出两种同时存在的AI观点,两种观点互不一致,他本人更偏向第一种
当前AI领域同时存在两种截然不同的叙事。第一种观点认为,借助AI一个人就能完成原本20人的工作,还能学习任何知识、创作任何内容,人们只需要学会使用Claude就可以。
第二种观点提出,企业已经投入数十亿美元资金,安排前置部署工程师帮用户落地AI,因为自己落地AI既耗时又难度太高。
HamelHusain个人更偏向第一种观点。他认为这两种叙事互相矛盾。
视频剪辑 · @0x_sakata▲ 1.5K
可通过Claude Code实现完全免费开源的AI视频剪辑
无需预设和菜单,自然语言描述需求即可,仅读取文本 transcript 大幅降低token消耗
可通过Claude Code实现完全免费开源的AI视频剪辑
无需预设和菜单,自然语言描述需求即可,仅读取文本 transcript 大幅降低token消耗
知识管理 · @kieranklaassen▲ 303
教你使用纯Markdown文件构建复利知识库
讲解Compound工程插件中的复利知识生命周期
教你使用纯Markdown文件构建复利知识库
讲解Compound工程插件中的复利知识生命周期
开源 · @_akhaliq▲ 4.3K
开发者称已完全迁移至开源模型日常使用GLM 5.2
一名开发者表示日常使用GLM 5.2,已完全转向开源模型
开发者称已完全迁移至开源模型日常使用GLM 5.2
一名开发者表示日常使用GLM 5.2,已完全转向开源模型
行业观点 · @emollick▲ 8.0K
业内观点:当前前沿AI缺少高目标野心实践
多数AI仅替代基础场景,长周期真实问题探索才具影响力
业内观点:当前前沿AI缺少高目标野心实践
多数AI仅替代基础场景,长周期真实问题探索才具影响力
你说得对……但这一点,或许还不如「人们不会用这些系统去尝试有野心的项目」这件事重要。
很多模型作为 Google 替代品,完成作业「辅导」之类的任务都表现得非常出色。
真正能产生影响力的,是有人将前沿 AI 作为智能体,用来解决长期跨度的真实问题。
商业 · @theinformation▲ 1.2K
大企业AI投入这么多,居然开始不让员工用外部工具了
Meta每年花数十亿美元做AI,现在要求员工减少使用外部 coding 辅助工具,优先用自家开发的工具
大企业AI投入这么多,居然开始不让员工用外部工具了
Meta每年花数十亿美元做AI,现在要求员工减少使用外部 coding 辅助工具,优先用自家开发的工具
职场 · @rohanpaul_ai▲ 872
现在顶级软件工程师,每月AI预算开到800美元了
这是特斯拉给工程师开出的新AI投入标准,这些工程师的工作已经接近物理机器和代码的极限
现在顶级软件工程师,每月AI预算开到800美元了
这是特斯拉给工程师开出的新AI投入标准,这些工程师的工作已经接近物理机器和代码的极限
针对软件工程师的全新AI预算基准可能已经定在了每月800美元。
这是特斯拉最新的AI支出标准。
考虑到这些工程师的工作已经接近物理机器与代码能力的极限,这个数字应该会成为各地软件AI预算的锚点。
隐私 · @BrianRoemmele▲ 1.5K
AI公司偷偷在输出文字里加了追踪你的水印
两家AI公司已经给大段输出文字加上了文本水印,部分水印还带能定位到个人的序列号
AI公司偷偷在输出文字里加了追踪你的水印
两家AI公司已经给大段输出文字加上了文本水印,部分水印还带能定位到个人的序列号
⚠️ 警告⚠️ 两家AI公司升级了它们用于大多数段落长度及更长文本输出的文本水印技术!
甚至在一些简单文本输出里,都藏着可追踪到你个人的序列号。
我的独家研究,你在其他任何地方都找不到。我会向你展示如何找到它并移除它。这是件大事。
独家文章即将推出。
产品 · @petergyang▲ 1.7K
OpenAI现在分三个产品,有人说完全没必要合并成一个就好
观点认为如果OpenAI做一个统一应用,把ChatGPT和Codex整合进去,还能保持易用,当前的产品拆分问题会更明显
OpenAI现在分三个产品,有人说完全没必要合并成一个就好
观点认为如果OpenAI做一个统一应用,把ChatGPT和Codex整合进去,还能保持易用,当前的产品拆分问题会更明显
💯 我真的不明白为什么非得做成三个独立的产品。
如果 OpenAI 能成功设计出一个统一应用,把 ChatGPT 整合进 Codex,同时保持直观易用——那现在这个拆分的问题就会更刺眼了。
商业 · @theinformation▲ 1.4K
AI取代分析师的担心刚消,token钱谁付又成了新问题
金融数据公司已经打消了AI抢饭碗的担忧,但投资者现在开始问:AI代理消耗的数据量远超过人类分析师,token费用到底谁来出
AI取代分析师的担心刚消,token钱谁付又成了新问题
金融数据公司已经打消了AI抢饭碗的担忧,但投资者现在开始问:AI代理消耗的数据量远超过人类分析师,token费用到底谁来出
技巧 · @louszbd▲ 115
用好AI提示的小技巧:先问「做什么」,再问「怎么做」
想要榨干模型的全部能力,先问方向再问方法,别让模型被你自己已有的认知限制住
用好AI提示的小技巧:先问「做什么」,再问「怎么做」
想要榨干模型的全部能力,先问方向再问方法,别让模型被你自己已有的认知限制住
真希望Thariq能更频繁地发内容。
我关于做规划的小技巧是:如果你想要从模型那里获得最大价值,先问「是什么」,再问「怎么做」。
这样一来,模型就不会被你已知的信息限制住,能发挥出它的最佳水平。
观点 · @jpschroeder▲ 156
好多聪明人,居然都不会用AI编码代理
这个判断针对2026年的行业状态,哪怕是高智商从业者,也未必能用好这类AI工具
好多聪明人,居然都不会用AI编码代理
这个判断针对2026年的行业状态,哪怕是高智商从业者,也未必能用好这类AI工具
行业动态 · Hacker News▲ 62
谷歌AI编程助手Gemini Code Assist 7月17日要关停
依赖这个AI编程工具的开发者,得提前找好替代方案了
谷歌AI编程助手Gemini Code Assist 7月17日要关停
依赖这个AI编程工具的开发者,得提前找好替代方案了
社区讨论:多名用户纠正原标题错误,本次仅关停GitHub上面向非企业用户的免费版Gemini Code Assist,并非全线停服,普遍吐槽谷歌产品命名混乱,不同版本名称相近、频繁更名,文档信息杂乱。不少用户借此提醒,要保持AI工作流可迁移,评估工具时需把工具消失后的迁移成本和功能放在同等权重考量,还有用户调侃谷歌产品管理能力差,调侃这次停服又可以更新谷歌埋葬品名单killedbygoogle.com了。
行业动态 · Hacker News▲ 259
想本地跑最先进大模型?这份指南火了
不用依赖云端API,按这份指南就能自己在本地跑SOTA大模型,适合不想把数据上传的人参考。
想本地跑最先进大模型?这份指南火了
不用依赖云端API,按这份指南就能自己在本地跑SOTA大模型,适合不想把数据上传的人参考。
社区讨论:多数本地大模型爱好者坦言,玩本地大模型硬件投入普遍偏高。指南里接近Claude Opus水平的顶配方案预算高达4万美元,实际要达到接近Opus的性能甚至需要40万美元,算下来比长期订阅GPT、Claude这类API服务贵得多。有人推荐性价比方案:3000美元可买带48GB内存的M系列Mac,或是单块RTX 3090就能运行Qwen3.6-27B的q4量化版本,也有人好奇介于入门和顶配之间的96GB VRAM千元方案的实际表现。
行业动态 · Hacker News▲ 140
学术报告不让用ChatGPT提示,这算歧视吗?
有人在2025年的学术报告中被禁止使用ChatGPT,当事人认为这属于歧视,此事引发了讨论。
学术报告不让用ChatGPT提示,这算歧视吗?
有人在2025年的学术报告中被禁止使用ChatGPT,当事人认为这属于歧视,此事引发了讨论。
社区讨论:多人认可当前学术圈日常用AI生成内容再修改的情况已经非常普遍。部分人认为禁止使用ChatGPT不合理,AI本质上和搜索工具能力没有区别,应该接受工具带来的效率提升。也有人反对,指出直接用AI生成内容再修改属于抄袭,允许 prompts 代替研究者本人准备报告,是浪费听众时间,称这项规定为歧视的说法很荒谬。
深度观点 · @fchollet▲ 1.1万
未来工作不再拼专业技能,要拼这个?
未来找工作,需要的是高适应力与创造力,核心是解决复杂问题,不再是重复执行或者单一专业技能
未来工作不再拼专业技能,要拼这个?
未来找工作,需要的是高适应力与创造力,核心是解决复杂问题,不再是重复执行或者单一专业技能
深度观点 · @victormustar▲ 1.3K
企业用AI很快就要自己部署了?
这一观点会改变企业AI投入的方向,值得留意
企业用AI很快就要自己部署了?
这一观点会改变企业AI投入的方向,值得留意
深度观点 · @Dan_Jeffries1▲ 516
遇到AI硬编码安全规则,就知道离AGI还有多远
处理日常任务时,模型还需要笨拙生硬、范围过大的硬编码安全规则,无法实时自我防护,这能帮判断我们离AGI还有多远。
遇到AI硬编码安全规则,就知道离AGI还有多远
处理日常任务时,模型还需要笨拙生硬、范围过大的硬编码安全规则,无法实时自我防护,这能帮判断我们离AGI还有多远。
当你在做一件日常小事时碰到一条愚蠢、生硬、范围过度宽泛的硬编码安全启发式规则,你就会完全清楚我们离 AGI 还有多远。
如果这些模型真的那么聪明,它们就能实时自我防护,根本不需要单独的分类器。
深度观点 · @chaykak▲ 611
现在有人训练大模型,要它必须有独特观点
现在行业都在要求大模型输出通用中立内容,有人反其道而行之,主动要求大模型给出鲜明独特的观点。
现在有人训练大模型,要它必须有独特观点
现在行业都在要求大模型输出通用中立内容,有人反其道而行之,主动要求大模型给出鲜明独特的观点。
前沿研究 · @omarsar0▲ 5.5K
旧论文思路改一改,居然干翻了全注意力
线性注意力为了省内存会丢失长信息,新方法HOLA加了一小块不压缩的精确缓存,参数更少效果反而比全注意力更好。
旧论文思路改一改,居然干翻了全注意力
线性注意力为了省内存会丢失长信息,新方法HOLA加了一小块不压缩的精确缓存,参数更少效果反而比全注意力更好。
这篇新论文值得一读,建议收藏。基本思路是将压缩循环状态与小型精确记忆配对,在保留线性注意力效率的同时,实现长范围召回。下文是更多介绍:
线性注意力和状态空间模型会将整个前缀压缩成固定大小的状态。这样就能获得O(1)内存复杂度,但当大量键值关联相互竞争时,更早的信息会被覆盖,“针查找”性能会下降。
HOLA为线性注意力补充了类似海马体的结构。它保留常规delta规则状态作为压缩记忆,额外添加了一个有界精确KV缓存,构成半参数测试时记忆。
状态负责建模可线性压缩的结构,缓存则存储不应通过压缩处理的关联。缓存写入时不需要学习淘汰模块,只保留预测残差实际提交给状态的token。
在15B SlimPajama token上训练,340M参数的HOLA将Wikitext困惑度从27.32降至22.92,优于全注意力Transformer++的26.88,并且在长达32k token的RULER针查找任务中保持鲁棒,这是它训练长度的16倍。
论文地址:
来我们的学院学习如何构建有效的AI agent:
新品发布 · @togethercompute▲ 2.2K
万亿token规模智能体推理,官方公开完整幻灯片
想学习大公司如何搭建万亿token生产规模的智能体推理引擎,可以直接下载官方放出的完整深入讲解幻灯片
万亿token规模智能体推理,官方公开完整幻灯片
想学习大公司如何搭建万亿token生产规模的智能体推理引擎,可以直接下载官方放出的完整深入讲解幻灯片
我们将发布我们在 AI Engineer World's Fair 进行的 2 小时深度探究环节的完整演示幻灯片。
我们在环节中介绍了我们如何构建推理引擎,以在万亿 token 生产规模下为智能体工作负载提供服务。
幻灯片 ⬇️
工具产品 · @7h3h4ckv157▲ 5.9K
开源情报监控中东战事 全程免费免API
整合了五十多个公开信息源,把新闻、社交、军事、金融数据整理在同一个实时看板里,完全免费,运行不需要API密钥
开源情报监控中东战事 全程免费免API
整合了五十多个公开信息源,把新闻、社交、军事、金融数据整理在同一个实时看板里,完全免费,运行不需要API密钥
用于监控中东冲突的实时开源情报(OSINT)指挥中心。
它聚合了来自50余个来源的开源情报:新闻、Telegram、军事追踪、金融市场,整合到同一个实时仪表板中。
无需API密钥。完全免费运行。
来源:
实战经验 · @AliGrids▲ 1.4万
GLM-5.2优化出的可视化,完全不像开源模型
有人用GLM-5.2优化出了漂亮的可视化效果,体验完全不像开源模型能做到的程度,可以关注开源大模型的实际能力提升
GLM-5.2优化出的可视化,完全不像开源模型
有人用GLM-5.2优化出了漂亮的可视化效果,体验完全不像开源模型能做到的程度,可以关注开源大模型的实际能力提升
行业观点 · @emollick▲ 8.0K
业内观点:当前前沿AI缺少高目标野心实践
多数AI仅替代基础场景,长周期真实问题探索才具影响力
业内观点:当前前沿AI缺少高目标野心实践
多数AI仅替代基础场景,长周期真实问题探索才具影响力
你说得对……但这一点,或许还不如「人们不会用这些系统去尝试有野心的项目」这件事重要。
很多模型作为 Google 替代品,完成作业「辅导」之类的任务都表现得非常出色。
真正能产生影响力的,是有人将前沿 AI 作为智能体,用来解决长期跨度的真实问题。
产品发布 · @framer▲ 1.3万
Fable 5大模型正式上线Framer设计平台
Fable 5性能优于Opus 4.8,更适配各类设计工作
Fable 5大模型正式上线Framer设计平台
Fable 5性能优于Opus 4.8,更适配各类设计工作
Fable 5 现已登陆 Framer。
它是我们测试过的最具主动性的模型,常常能超出任务要求,产出风格更鲜明、可复用元素更丰富、首轮结果更精致的作品。
它尤其擅长原创设计工作、着色器和细腻动效。
在我们的评估中,Fable 5 总分为 83%,领先于得分为 77% 的 Opus 4.8,并且在设计分项以 81% 的得分领跑所有模型。它消耗的 credits 是 GPT 5.5 的 2 倍。
在 Framer 中了解更多关于 Fable 的信息:
开源 · @_akhaliq▲ 4.3K
开发者称已完全迁移至开源模型日常使用GLM 5.2
一名开发者表示日常使用GLM 5.2,已完全转向开源模型
开发者称已完全迁移至开源模型日常使用GLM 5.2
一名开发者表示日常使用GLM 5.2,已完全转向开源模型
大模型 · @yuhasbeentaken▲ 1.7万
GLM-5.2现已上线NVIDIA NIM并提供免费端点
GLM-5.2上线NVIDIA NIM,速度免费优势明显但模型质量较低
GLM-5.2现已上线NVIDIA NIM并提供免费端点
GLM-5.2上线NVIDIA NIM,速度免费优势明显但模型质量较低
GLM-5.2 现已通过 NVIDIA NIM 开放,提供免费端点。
优势:模型速度快,完全免费。
缺点:NVIDIA 似乎使用的是量化版本,生成质量低于官方 API。
我们正在开发 @OffloopHQ ,让智能体与人类能在 workspace 中协作!
大模型 · @Im_IrushiK▲ 7.7K
用户征集性能优于GLM 5.2的开源大模型
社交平台用户发起征集,寻找比GLM 5.2更好的开源模型
用户征集性能优于GLM 5.2的开源大模型
社交平台用户发起征集,寻找比GLM 5.2更好的开源模型
开源 · @AlbertQJiang▲ 1.9万
Leanstral 1.5大模型发布 多项推理 benchmark达SOTA
6B参数开源大模型Leanstral 1.5正式发布,多项测评达最优
Leanstral 1.5大模型发布 多项推理 benchmark达SOTA
6B参数开源大模型Leanstral 1.5正式发布,多项测评达最优
Leanstral 1.5 已发布。它在 FATE-H/X 上达到当前最优水平,在 PutnamBench 上得分为 587,在 miniF2F 上达到饱和,所有这些都来自一个采用 Apache-2 许可证、拥有 6B 激活参数的模型。
我们现在正愉快地验证代码属性,在 Rust 代码仓库中排查错误!
涵盖训练环境和评估结果的技术报告已发布。我们同时开源了 LeanstralSafeVerify 和 FLTEval。
知识管理 · @kieranklaassen▲ 303
教你使用纯Markdown文件构建复利知识库
讲解Compound工程插件中的复利知识生命周期
教你使用纯Markdown文件构建复利知识库
讲解Compound工程插件中的复利知识生命周期
大模型 · @omarsar0▲ 8.1K
业内人士称GPT-5.6或将成为OpenAI的重大胜利
业内观点认为GPT-5.6是前沿模型的决定性时刻,需重视用户体验
业内人士称GPT-5.6或将成为OpenAI的重大胜利
业内观点认为GPT-5.6是前沿模型的决定性时刻,需重视用户体验
我相信 GPT-5.6 会是 OpenAI 的一场巨大胜利。这会是前沿模型的决定性时刻。
但他们需要仔细打磨用户体验。
在我看来,Fable 5 重新发布就是因为这个原因搞砸了。
我并不完全反对护栏机制,但把这件事做对非常重要。
视频剪辑 · @0x_sakata▲ 1.5K
可通过Claude Code实现完全免费开源的AI视频剪辑
无需预设和菜单,自然语言描述需求即可,仅读取文本 transcript 大幅降低token消耗
可通过Claude Code实现完全免费开源的AI视频剪辑
无需预设和菜单,自然语言描述需求即可,仅读取文本 transcript 大幅降低token消耗
观点 · @HamelHusain▲ 631
当前存在两种互相矛盾的AI发展叙事
HamelHusain在𝕏提出两种同时存在的AI观点,两种观点互不一致,他本人更偏向第一种
当前存在两种互相矛盾的AI发展叙事
HamelHusain在𝕏提出两种同时存在的AI观点,两种观点互不一致,他本人更偏向第一种
当前AI领域同时存在两种截然不同的叙事。第一种观点认为,借助AI一个人就能完成原本20人的工作,还能学习任何知识、创作任何内容,人们只需要学会使用Claude就可以。
第二种观点提出,企业已经投入数十亿美元资金,安排前置部署工程师帮用户落地AI,因为自己落地AI既耗时又难度太高。
HamelHusain个人更偏向第一种观点。他认为这两种叙事互相矛盾。
大模型 · @nicdunz▲ 264
开发者分享大模型使用习惯从最强模型转向小模型
小模型性能提升后,开发者默认用小模型仅在需要时切大模型,讨论自动路由可行性
开发者分享大模型使用习惯从最强模型转向小模型
小模型性能提升后,开发者默认用小模型仅在需要时切大模型,讨论自动路由可行性
此前我做任何任务都会默认选用性能最强的大模型,因为小型大模型一直能力太差。
如今小型大模型的实际性能已经相当出色,我开始更享受默认使用小模型的状态。
小模型运行速度更快,我只在有需要的时候才切换到性能最强的大模型。
我好奇自动路由是不是推出得太早了。
自动路由刚出现的时候,小模型确实速度快,但能力仍然不足,这可能是当时没人接受它的原因。
现在自动路由或许真的是正确方向,因为哪怕用小模型,一半的任务都能搞定,不需要切换。