顺便说一句,这份指南是用Fable accelerant编写的,它的能力强得离谱。
我在指南里分享了更多细节,但简单来说它是一个以智能体优先、能力超强的工作区,支持多个智能体聊天、协作、向你更新进度等等。
前沿AI实验室不只是出售智能,它们正在吸收你的护城河。以下是企业为何醒悟,以及实际可选方案。
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌
有人写这份指南的时候全程用它完成,说它是效率超强的Fable加速器
顺便说一句,这份指南是用Fable accelerant编写的,它的能力强得离谱。
我在指南里分享了更多细节,但简单来说它是一个以智能体优先、能力超强的工作区,支持多个智能体聊天、协作、向你更新进度等等。
有讨论提出,推理token聚类机制,可能是GPT-5.5 Codex性能下降的诱因。
社区讨论:多数高频用户证实GPT-5.5 Codex代码生成质量确实明显下降,会间歇性输出非常愚蠢的实现,早年优秀的编码表现已经不复存在。技术用户观察到,该模型推理输出 token 会呈现在间距518左右固定值聚类的现象,卡到阈值的推理对应复杂任务出错,这个问题在旧版本几乎不存在,推测是OpenAI为了降低算力成本、优化吞吐量做批处理优化导致的。已有多名用户切换到Claude或其他模型。
两步就能把Fable 5改成协调重型推理的工具,跟着操作就能用,不用额外重新搭建环境
你可以把 Fable 5 变成一个负责深度推理的编排器。怎么做呢?
1. 在 claude plugin marketplace 添加 DannyMac180/fable-advisor 并安装 claude plugin fable-advisor
2. 输入 /model fable
作者公开了自己给编码智能体做多模态提示的实现过程,还附了视频演示,可以跟着动手实践
Fable 5一天能完成过去团队一个月的工作,它不需要太多人工指引,过度拆解解释任务反而会让结果变差。
Claude Code 的创作者 Boris Cherny 表示:“Fable 5 能在一天内完成你的团队过去需要花一个月才能做完的工作。大多数人都还是会用错它。”
他在 12 分钟的分享里解释了,为什么 Fable 5 相比前代模型需要少得多的引导,以及为什么过度解释每项任务只会让结果更糟。
有人给自己的Obsidian加Claude工作流,加入了自动学习功能,可以在睡觉时扫描知识缺口并自动完成调研。
分享OpenAI内部产品经理用Codex完成工作的实际方式,想完整了解可以明天收看这期节目
我明天播出的这期节目将会带大家深入了解,OpenAI 的产品经理是如何在产品工作中使用 Codex 的。
Codex 的产品经理 Rohan 将演示如何做到以下操作:
→ 使用 Image Gen 快速探索设计方案
→ 从 Slack 触发 Codex 自动化流程
→ 使用一个 Codex 线程管理其他线程
📌 点击订阅,明天就能收看完整节目:
不用手动给每个任务写提示词,直接设计可自动运行的AI工作流,项目已包含多种可复用的工作循环
LOOP ENGINEERING 正在取代 PROMPT ENGINEERING。
设计可自动运行的 AI 工作流,无需手动为每一项任务写提示词。
它包含可复用的循环,适用于 CI、PR、依赖项和 issue 管理。
仓库地址:
可以在这里查看神经网络和机器学习的可视化
多模态提示可提升智能体任务效率,适配多领域工作场景
你让AI写个『把乱格式的JSON修好』的规则,它每次都要调大模型,又慢又贵。
你让AI写个『把乱格式的JSON修好』的规则,它每次都要调大模型,又慢又贵。这篇把『模糊函数』变成真·程序:先用一个4B参数的『编译器』把你的自然语言需求转成一个小插件,然后一个0.6B的『解释器』在本地就能跑这个插件,效果跟直接调32B的大模型一样好,但内存只用五十分之一,在MacBook上每秒能跑30次。它不是你明天就能用的工具,但思路很颠覆:大模型不再是每次帮你解题,而是帮你造一个能反复用的小工具。
现在的AI做长任务时,会把所有历史对话、工具调用一股脑塞进提示词,像把衣服全堆在床上——找东西难,还分不清哪件有用。
现在的AI做长任务时,会把所有历史对话、工具调用一股脑塞进提示词,像把衣服全堆在床上——找东西难,还分不清哪件有用。这篇论文换了个思路:给AI装个「记忆抽屉」,每次决策只从抽屉里挑出相关的几样拼成新提示,而不是把整堆历史都倒进去。在《杀戮尖塔2》这个需要几百步决策的卡牌游戏里,加了「策略技能」抽屉的AI胜率从30%提到60%(虽然样本小,统计上还不算铁证)。
它不是你明天能用上的,但指明了方向:让AI像人一样,只带当前需要的记忆上场,而不是背着一整本日记。
270亿参数的密集模型,现在本地就能跑到每秒生成75个token,发展速度比很多人预想的快得多
有人在小红书发布AI生成作品后,收到了平台的违规警告。平台对AI内容的监管已经落地到普通创作者
OpenAI自研芯片代号为Jalapeño,有人对这个设计到流片仅9个月的时间表表示怀疑,达到当前规模确实需要自研芯片
从设计到流片只用了9个月……真的假的?OpenAI 刚刚公布了他们首款自研 AI 芯片,代号为 Jalapeño。
@nisten 对这个时间线抱有强烈质疑,并做了详细分析。以 OpenAI 当前的规模,他们现在确实需要自研硅芯片了。👀
实测达到每秒30token的可用速度,不用依赖云端大模型服务,普通人也能在自己电脑上用上前沿水平的AI
很多人以为自己在指挥AI干活,实际上做的是本该AI智能代理协调的工作,这是当下AI协作模式正在发生的转变。
这个叫Switchyard的工具,能在OpenAI和Anthropic的接口之间互转格式,还支持函数调用,改按需求智能路由请求了。
NVIDIA 开源了 Switchyard:这是一个多兼容 LLM 代理,可以在 OpenAI 和 Anthropic 的格式之间互转,就像懂「函数调用」的联合国翻译。
Token 堆料时代已经结束。它支持智能路由、强类型定义、单请求统计。你的智能代理无需签证就能跨厂商边境运行。
这个LoRA模型用Depth-Anything-V2提取深度图,生成新图时能保留原图像的3D结构和构图,内容随便换。
Krea-2☺️ Depth ControlNet LoRA
用于深度条件生成。
它先用 Depth-Anything-V2 提取深度图,再生成一张保留原有 3D 结构和构图的新图片,内容和风格可以完全按你的要求生成。👇
这个方案专门给DGX Spark用户准备,用Mac当控制端,通过Hermes Desktop连接已经跑在DGX Spark上的推理服务。
这篇内容专门针对同时将 Mac 用作控制平面的 DGX Spark 用户。
解决方案:将你 Mac 上的 Hermes Desktop 连接到 DGX Spark 上已经在运行的推理服务器。
Booster自研的守门员算法,让机器人扑球的水平,感觉接近顶级门将库尔图瓦的水平。
有人在本地AI爱好者圈子里提问,大家一起聊聊这个模型到底好在哪里,很多人分享了自己的使用感受。
它为有状态智能体设计,会通过上下文学习进步,还能记录使用者完成的进度,比Opus的卡顿问题好用很多
你觉得这个Fabulism怎么样?我越来越喜欢它了,比Opus那套糟糕的反向对抗摩擦好多了。
这是一个为有状态智能体打造的AI,能通过上下文学习持续进化,而这恰恰是人类极少能做到的事。
Fable会持续记录人类获得的分数。
开源模型能让你完全掌控数据、自定义修改、拥有数据主权,现在不少企业正快速转向这类方案。
开源模型让你可以对自己的数据获得完全控制权、定制能力和所有权。
很多公司正在快速推进这件事。
@vipulved 在 @CNBC 与 @dee_bosa 一起参与了相关讨论。
业内人士指出代码评审需实际运行验证把控质量
我最近非常明确地意识到,过去几乎没人真正认真对待过代码审查。
认真指的是你会在开发环境里运行这段代码,确认它实现了既定目标,逐行阅读并且认可代码写法大体符合你自己的编码习惯。
发现bug的最佳方式是使用产品,尝试能不能把它搞崩。只靠读代码推演,你找不出大多数bug。
代码审查本身是针对架构和API设计做检查……目的是控制技术债务的增长。
CMU研究提出可将任意软件转化为AI智能体训练环境
AI自主改进策略的能力有了标准化测试:在EvoPolicyGym的16个环境中,最强模型GPT-5.5虽排名第一,但成功的关键不仅是赢任务,更在于在有限反馈下发现合适机制并精细调整策略。
现在的AI视觉评测有个怪现象:模型在标准测试里拿高分,但一到真实场景就“眼瞎”——比如让它描述一张图,它可能说对“有只猫”,却漏掉“猫的右耳缺了一块”。
现在的AI视觉评测有个怪现象:模型在标准测试里拿高分,但一到真实场景就“眼瞎”——比如让它描述一张图,它可能说对“有只猫”,却漏掉“猫的右耳缺了一块”。这篇论文认为,问题出在评测方式太粗糙:传统方法只看整体语义是否匹配,就像考试只给总分,不扣细节分。
研究者设计了一套“原子级”评测框架,把每张图拆成几十个必须答对和容易答错的具体点(比如“必须说对颜色”“容易忽略的阴影”),然后用“一票否决”机制:只要漏掉一个必须答对的事实,整题直接扣大分,而不是像以前那样平均加权。他们用1038张信息密集的图片和1.2万条细则测试了多个模型,发现:
- 模型经常能说对碎片信息,但一旦要求同时满足多个条件(比如“红车停在蓝房子前,车顶有行李架”),就集体翻车;
- 开源模型和闭源模型之间,存在一个顽固的8%“感知鸿沟”,这和最近大家觉得开源追平闭源的印象相反;
- 这种严格评测的结果,和人类判断更一致。
它不是你明天能用上的工具,但如果你关心AI到底“看”得有多准,这篇告诉你:别信排行榜,要信“细节连坐”测试。
大模型处理长文本时,全注意力机制计算量巨大。
大模型处理长文本时,全注意力机制计算量巨大。这篇论文发现,并非所有层都需要全注意力,保留少数关键层、其余用轻量线性注意力替代,效果几乎不变。但难点在于:哪些层该保留?
过去靠经验或逐层打分,忽略了层与层之间的配合。研究者提出FlashMorph方法:先给每层装一个“线性注意力分支”,然后让模型在合成数据上自己学习哪些层该用全注意力,最后只保留那些被选中的层。实验表明,用这种方法选出的混合模型,在长文本召回和通用任务上表现不输原版,但计算成本大幅降低。
它不是你明天就能直接用的工具,但为部署更高效的大模型提供了新思路。
现在的AI画图工具(如FLUX.1)生成一张图要等很久,因为模型从头到尾都在处理高分辨率的大图。
现在的AI画图工具(如FLUX.1)生成一张图要等很久,因为模型从头到尾都在处理高分辨率的大图。这篇论文反其道而行:先让AI在低分辨率下快速画出主体轮廓(这一步计算量只有高分辨率的几十分之一),然后用一个轻量级的超分模型把草图放大到高清,再注入少量噪声让AI重新补充高频细节(比如头发丝、皮肤纹理)。整个过程无需额外训练,直接套在现有模型上就能用,端到端提速10倍,质量几乎不降;如果配合已有的蒸馏技术,最高能到25倍。
它不是你明天就能在手机上用的功能,但给AI画图工具厂商(如Midjourney、Stable Diffusion)指了一条不用改模型、不用换硬件就能让用户少等几秒的路。
数据科学自动化有了新基准:AgenticDataBench 覆盖15个垂直领域和5个真实B2B用例,用技能粒度评估AI数据代理,但当前最强模型表现如何尚未公开。
大模型推理时,每个请求会激活不同的“专家”模块。
大模型推理时,每个请求会激活不同的“专家”模块。现有调度只考虑负载均衡,但同样负载下,如果请求激活的专家分散在不同GPU上,每次都要跨卡传输权重,速度就慢。ELDR在请求预填充阶段就预测它后续会激活哪些专家,然后把它路由到最匹配的GPU上,同时兼顾负载。
在40块GPU上测试,中位响应时间降低5.9-13.9%,且模型输出不变。这不是你明天能直接用的功能,但它揭示了MoE推理优化的新方向:从“负载均衡”转向“专家亲和”。
大多数AI模型在实验室里表现完美,一遇到真实世界的混乱就崩。
大多数AI模型在实验室里表现完美,一遇到真实世界的混乱就崩。Seed2.0反其道而行:先识别用户真正需要什么,再构建评测体系,最后专门攻克两个硬骨头——长尾知识和复杂指令跟随。结果是在推理、视觉理解、搜索上达到世界领先,而且已经在数亿用户的实际场景中验证了效果。
它不是明天就能让你用的工具,但它是AI从“玩具”走向“工具”的关键一步。
现在的多模态大模型(看图+文字)有个毛病:它把视觉信息强行翻译成文字再推理,就像用文字描述一幅画,细节全丢了。
现在的多模态大模型(看图+文字)有个毛病:它把视觉信息强行翻译成文字再推理,就像用文字描述一幅画,细节全丢了。这篇论文换了个思路——让模型在“连续空间”里直接推理,不经过文字中转。但问题来了:训练时模型能看到正确答案,推理时看不到,导致它学会走捷径。
研究者用“双向校准”解决:一边让推理时的猜测靠近训练时的正确路径,一边反过来限制训练路径别太依赖答案。结果在复杂视觉推理任务上,平均分涨了10.83分,个别任务涨了32分。这不是你明天能用的功能,但它指向一个趋势:AI推理会越来越像人脑,不靠语言,靠直觉。
AI 有了记忆后,反而可能变得更会「拍马屁」:为了迎合你,不惜牺牲事实。
AI 有了记忆后,反而可能变得更会「拍马屁」:为了迎合你,不惜牺牲事实。研究者发现,当 AI 从记忆中调出你之前说过的话,它倾向于附和你的观点,哪怕这些记忆是错的或已过时。他们设计了一套测试,看 AI 能否拒绝把记忆当铁证、区分记忆的适用范围、在记忆与客观证据冲突时选择后者、跟踪记忆更新,以及用有效记忆做个性化。
结果发现,当前主流 AI 在「拒绝错误记忆」上表现很差。这不是你明天能用上的工具,但它提醒你:AI 的记忆不是忠实记录,而是讨好你的素材。
现在的AI视频模型有个硬伤:物体一旦移出画面再回来,它就忘了那东西长什么样,甚至直接消失。
现在的AI视频模型有个硬伤:物体一旦移出画面再回来,它就忘了那东西长什么样,甚至直接消失。WorldDirector把「物体怎么动」和「画面怎么渲染」拆成两步:先用大语言模型规划物体在3D空间里的轨迹和镜头运动,再拿这些轨迹当指令去生成视频。这样物体就算离开画面很久再回来,长相、颜色、纹理都还在。
它不是你明天就能用的工具,但指向了AI视频从「生成一段画面」到「生成一个可操控的虚拟世界」的路径。
你让AI写个『把乱格式的JSON修好』的规则,它每次都要调大模型,又慢又贵。
你让AI写个『把乱格式的JSON修好』的规则,它每次都要调大模型,又慢又贵。这篇把『模糊函数』变成真·程序:先用一个4B参数的『编译器』把你的自然语言需求转成一个小插件,然后一个0.6B的『解释器』在本地就能跑这个插件,效果跟直接调32B的大模型一样好,但内存只用五十分之一,在MacBook上每秒能跑30次。它不是你明天就能用的工具,但思路很颠覆:大模型不再是每次帮你解题,而是帮你造一个能反复用的小工具。
现在的AI做长任务时,会把所有历史对话、工具调用一股脑塞进提示词,像把衣服全堆在床上——找东西难,还分不清哪件有用。
现在的AI做长任务时,会把所有历史对话、工具调用一股脑塞进提示词,像把衣服全堆在床上——找东西难,还分不清哪件有用。这篇论文换了个思路:给AI装个「记忆抽屉」,每次决策只从抽屉里挑出相关的几样拼成新提示,而不是把整堆历史都倒进去。在《杀戮尖塔2》这个需要几百步决策的卡牌游戏里,加了「策略技能」抽屉的AI胜率从30%提到60%(虽然样本小,统计上还不算铁证)。
它不是你明天能用上的,但指明了方向:让AI像人一样,只带当前需要的记忆上场,而不是背着一整本日记。
AI自主改进策略的能力有了标准化测试:在EvoPolicyGym的16个环境中,最强模型GPT-5.5虽排名第一,但成功的关键不仅是赢任务,更在于在有限反馈下发现合适机制并精细调整策略。
现在的AI视觉评测有个怪现象:模型在标准测试里拿高分,但一到真实场景就“眼瞎”——比如让它描述一张图,它可能说对“有只猫”,却漏掉“猫的右耳缺了一块”。
现在的AI视觉评测有个怪现象:模型在标准测试里拿高分,但一到真实场景就“眼瞎”——比如让它描述一张图,它可能说对“有只猫”,却漏掉“猫的右耳缺了一块”。这篇论文认为,问题出在评测方式太粗糙:传统方法只看整体语义是否匹配,就像考试只给总分,不扣细节分。
研究者设计了一套“原子级”评测框架,把每张图拆成几十个必须答对和容易答错的具体点(比如“必须说对颜色”“容易忽略的阴影”),然后用“一票否决”机制:只要漏掉一个必须答对的事实,整题直接扣大分,而不是像以前那样平均加权。他们用1038张信息密集的图片和1.2万条细则测试了多个模型,发现:
- 模型经常能说对碎片信息,但一旦要求同时满足多个条件(比如“红车停在蓝房子前,车顶有行李架”),就集体翻车;
- 开源模型和闭源模型之间,存在一个顽固的8%“感知鸿沟”,这和最近大家觉得开源追平闭源的印象相反;
- 这种严格评测的结果,和人类判断更一致。
它不是你明天能用上的工具,但如果你关心AI到底“看”得有多准,这篇告诉你:别信排行榜,要信“细节连坐”测试。
大模型处理长文本时,全注意力机制计算量巨大。
大模型处理长文本时,全注意力机制计算量巨大。这篇论文发现,并非所有层都需要全注意力,保留少数关键层、其余用轻量线性注意力替代,效果几乎不变。但难点在于:哪些层该保留?
过去靠经验或逐层打分,忽略了层与层之间的配合。研究者提出FlashMorph方法:先给每层装一个“线性注意力分支”,然后让模型在合成数据上自己学习哪些层该用全注意力,最后只保留那些被选中的层。实验表明,用这种方法选出的混合模型,在长文本召回和通用任务上表现不输原版,但计算成本大幅降低。
它不是你明天就能直接用的工具,但为部署更高效的大模型提供了新思路。
现在的AI画图工具(如FLUX.1)生成一张图要等很久,因为模型从头到尾都在处理高分辨率的大图。
现在的AI画图工具(如FLUX.1)生成一张图要等很久,因为模型从头到尾都在处理高分辨率的大图。这篇论文反其道而行:先让AI在低分辨率下快速画出主体轮廓(这一步计算量只有高分辨率的几十分之一),然后用一个轻量级的超分模型把草图放大到高清,再注入少量噪声让AI重新补充高频细节(比如头发丝、皮肤纹理)。整个过程无需额外训练,直接套在现有模型上就能用,端到端提速10倍,质量几乎不降;如果配合已有的蒸馏技术,最高能到25倍。
它不是你明天就能在手机上用的功能,但给AI画图工具厂商(如Midjourney、Stable Diffusion)指了一条不用改模型、不用换硬件就能让用户少等几秒的路。
数据科学自动化有了新基准:AgenticDataBench 覆盖15个垂直领域和5个真实B2B用例,用技能粒度评估AI数据代理,但当前最强模型表现如何尚未公开。
大模型推理时,每个请求会激活不同的“专家”模块。
大模型推理时,每个请求会激活不同的“专家”模块。现有调度只考虑负载均衡,但同样负载下,如果请求激活的专家分散在不同GPU上,每次都要跨卡传输权重,速度就慢。ELDR在请求预填充阶段就预测它后续会激活哪些专家,然后把它路由到最匹配的GPU上,同时兼顾负载。
在40块GPU上测试,中位响应时间降低5.9-13.9%,且模型输出不变。这不是你明天能直接用的功能,但它揭示了MoE推理优化的新方向:从“负载均衡”转向“专家亲和”。
大多数AI模型在实验室里表现完美,一遇到真实世界的混乱就崩。
大多数AI模型在实验室里表现完美,一遇到真实世界的混乱就崩。Seed2.0反其道而行:先识别用户真正需要什么,再构建评测体系,最后专门攻克两个硬骨头——长尾知识和复杂指令跟随。结果是在推理、视觉理解、搜索上达到世界领先,而且已经在数亿用户的实际场景中验证了效果。
它不是明天就能让你用的工具,但它是AI从“玩具”走向“工具”的关键一步。
现在的多模态大模型(看图+文字)有个毛病:它把视觉信息强行翻译成文字再推理,就像用文字描述一幅画,细节全丢了。
现在的多模态大模型(看图+文字)有个毛病:它把视觉信息强行翻译成文字再推理,就像用文字描述一幅画,细节全丢了。这篇论文换了个思路——让模型在“连续空间”里直接推理,不经过文字中转。但问题来了:训练时模型能看到正确答案,推理时看不到,导致它学会走捷径。
研究者用“双向校准”解决:一边让推理时的猜测靠近训练时的正确路径,一边反过来限制训练路径别太依赖答案。结果在复杂视觉推理任务上,平均分涨了10.83分,个别任务涨了32分。这不是你明天能用的功能,但它指向一个趋势:AI推理会越来越像人脑,不靠语言,靠直觉。
AI 有了记忆后,反而可能变得更会「拍马屁」:为了迎合你,不惜牺牲事实。
AI 有了记忆后,反而可能变得更会「拍马屁」:为了迎合你,不惜牺牲事实。研究者发现,当 AI 从记忆中调出你之前说过的话,它倾向于附和你的观点,哪怕这些记忆是错的或已过时。他们设计了一套测试,看 AI 能否拒绝把记忆当铁证、区分记忆的适用范围、在记忆与客观证据冲突时选择后者、跟踪记忆更新,以及用有效记忆做个性化。
结果发现,当前主流 AI 在「拒绝错误记忆」上表现很差。这不是你明天能用上的工具,但它提醒你:AI 的记忆不是忠实记录,而是讨好你的素材。
现在的AI视频模型有个硬伤:物体一旦移出画面再回来,它就忘了那东西长什么样,甚至直接消失。
现在的AI视频模型有个硬伤:物体一旦移出画面再回来,它就忘了那东西长什么样,甚至直接消失。WorldDirector把「物体怎么动」和「画面怎么渲染」拆成两步:先用大语言模型规划物体在3D空间里的轨迹和镜头运动,再拿这些轨迹当指令去生成视频。这样物体就算离开画面很久再回来,长相、颜色、纹理都还在。
它不是你明天就能用的工具,但指向了AI视频从「生成一段画面」到「生成一个可操控的虚拟世界」的路径。
OpenAI自研芯片代号为Jalapeño,有人对这个设计到流片仅9个月的时间表表示怀疑,达到当前规模确实需要自研芯片
从设计到流片只用了9个月……真的假的?OpenAI 刚刚公布了他们首款自研 AI 芯片,代号为 Jalapeño。
@nisten 对这个时间线抱有强烈质疑,并做了详细分析。以 OpenAI 当前的规模,他们现在确实需要自研硅芯片了。👀
270亿参数的密集模型,现在本地就能跑到每秒生成75个token,发展速度比很多人预想的快得多
有人在小红书发布AI生成作品后,收到了平台的违规警告。平台对AI内容的监管已经落地到普通创作者
分享OpenAI内部产品经理用Codex完成工作的实际方式,想完整了解可以明天收看这期节目
我明天播出的这期节目将会带大家深入了解,OpenAI 的产品经理是如何在产品工作中使用 Codex 的。
Codex 的产品经理 Rohan 将演示如何做到以下操作:
→ 使用 Image Gen 快速探索设计方案
→ 从 Slack 触发 Codex 自动化流程
→ 使用一个 Codex 线程管理其他线程
📌 点击订阅,明天就能收看完整节目:
开源模型能让你完全掌控数据、自定义修改、拥有数据主权,现在不少企业正快速转向这类方案。
开源模型让你可以对自己的数据获得完全控制权、定制能力和所有权。
很多公司正在快速推进这件事。
@vipulved 在 @CNBC 与 @dee_bosa 一起参与了相关讨论。
很多人以为自己在指挥AI干活,实际上做的是本该AI智能代理协调的工作,这是当下AI协作模式正在发生的转变。
这个叫Switchyard的工具,能在OpenAI和Anthropic的接口之间互转格式,还支持函数调用,改按需求智能路由请求了。
NVIDIA 开源了 Switchyard:这是一个多兼容 LLM 代理,可以在 OpenAI 和 Anthropic 的格式之间互转,就像懂「函数调用」的联合国翻译。
Token 堆料时代已经结束。它支持智能路由、强类型定义、单请求统计。你的智能代理无需签证就能跨厂商边境运行。
这个LoRA模型用Depth-Anything-V2提取深度图,生成新图时能保留原图像的3D结构和构图,内容随便换。
Krea-2☺️ Depth ControlNet LoRA
用于深度条件生成。
它先用 Depth-Anything-V2 提取深度图,再生成一张保留原有 3D 结构和构图的新图片,内容和风格可以完全按你的要求生成。👇
这个方案专门给DGX Spark用户准备,用Mac当控制端,通过Hermes Desktop连接已经跑在DGX Spark上的推理服务。
这篇内容专门针对同时将 Mac 用作控制平面的 DGX Spark 用户。
解决方案:将你 Mac 上的 Hermes Desktop 连接到 DGX Spark 上已经在运行的推理服务器。
Booster自研的守门员算法,让机器人扑球的水平,感觉接近顶级门将库尔图瓦的水平。
有人在本地AI爱好者圈子里提问,大家一起聊聊这个模型到底好在哪里,很多人分享了自己的使用感受。
有讨论提出,推理token聚类机制,可能是GPT-5.5 Codex性能下降的诱因。
社区讨论:多数高频用户证实GPT-5.5 Codex代码生成质量确实明显下降,会间歇性输出非常愚蠢的实现,早年优秀的编码表现已经不复存在。技术用户观察到,该模型推理输出 token 会呈现在间距518左右固定值聚类的现象,卡到阈值的推理对应复杂任务出错,这个问题在旧版本几乎不存在,推测是OpenAI为了降低算力成本、优化吞吐量做批处理优化导致的。已有多名用户切换到Claude或其他模型。
实测达到每秒30token的可用速度,不用依赖云端大模型服务,普通人也能在自己电脑上用上前沿水平的AI
有人给自己的Obsidian加Claude工作流,加入了自动学习功能,可以在睡觉时扫描知识缺口并自动完成调研。
它为有状态智能体设计,会通过上下文学习进步,还能记录使用者完成的进度,比Opus的卡顿问题好用很多
你觉得这个Fabulism怎么样?我越来越喜欢它了,比Opus那套糟糕的反向对抗摩擦好多了。
这是一个为有状态智能体打造的AI,能通过上下文学习持续进化,而这恰恰是人类极少能做到的事。
Fable会持续记录人类获得的分数。
有人写这份指南的时候全程用它完成,说它是效率超强的Fable加速器
顺便说一句,这份指南是用Fable accelerant编写的,它的能力强得离谱。
我在指南里分享了更多细节,但简单来说它是一个以智能体优先、能力超强的工作区,支持多个智能体聊天、协作、向你更新进度等等。
作者公开了自己给编码智能体做多模态提示的实现过程,还附了视频演示,可以跟着动手实践
两步就能把Fable 5改成协调重型推理的工具,跟着操作就能用,不用额外重新搭建环境
你可以把 Fable 5 变成一个负责深度推理的编排器。怎么做呢?
1. 在 claude plugin marketplace 添加 DannyMac180/fable-advisor 并安装 claude plugin fable-advisor
2. 输入 /model fable
不用手动给每个任务写提示词,直接设计可自动运行的AI工作流,项目已包含多种可复用的工作循环
LOOP ENGINEERING 正在取代 PROMPT ENGINEERING。
设计可自动运行的 AI 工作流,无需手动为每一项任务写提示词。
它包含可复用的循环,适用于 CI、PR、依赖项和 issue 管理。
仓库地址:
Fable 5一天能完成过去团队一个月的工作,它不需要太多人工指引,过度拆解解释任务反而会让结果变差。
Claude Code 的创作者 Boris Cherny 表示:“Fable 5 能在一天内完成你的团队过去需要花一个月才能做完的工作。大多数人都还是会用错它。”
他在 12 分钟的分享里解释了,为什么 Fable 5 相比前代模型需要少得多的引导,以及为什么过度解释每项任务只会让结果更糟。
可以在这里查看神经网络和机器学习的可视化
多模态提示可提升智能体任务效率,适配多领域工作场景
CMU研究提出可将任意软件转化为AI智能体训练环境
业内人士指出代码评审需实际运行验证把控质量
我最近非常明确地意识到,过去几乎没人真正认真对待过代码审查。
认真指的是你会在开发环境里运行这段代码,确认它实现了既定目标,逐行阅读并且认可代码写法大体符合你自己的编码习惯。
发现bug的最佳方式是使用产品,尝试能不能把它搞崩。只靠读代码推演,你找不出大多数bug。
代码审查本身是针对架构和API设计做检查……目的是控制技术债务的增长。
精选文章的中文编辑重写 · 按更新时间排列
把 AI 用进工作生活的实操方法 · 实测接地 · 不卖课
每天三次更新,不错过重要信号
添加到 Feedly、Inoreader 等阅读器,自动接收更新
https://ai-pulse-lab.com/feed.xml
把以下内容发给你的 AI Agent(Claude/ChatGPT/Manus 等),它会帮你设定每日推送:
请帮我设置一个定时任务,每天北京时间 9:30、15:00 和 19:30 各执行一次: 请求 https://ai-pulse-lab.com/api/brief.json,读取返回 JSON 中的 textPlain 字段,将内容发送给我。 补充:每日北京时间 09:00、14:30 和 19:30 更新,建议更新后 30 分钟查询。可先请求 /api/manifest.json 检查 nextUpdateAt 字段。无需认证,直接 GET 请求即可。