社区讨论:多数高频用户证实GPT-5.5 Codex代码生成质量确实明显下降,会间歇性输出非常愚蠢的实现,早年优秀的编码表现已经不复存在。技术用户观察到,该模型推理输出 token 会呈现在间距518左右固定值聚类的现象,卡到阈值的推理对应复杂任务出错,这个问题在旧版本几乎不存在,推测是OpenAI为了降低算力成本、优化吞吐量做批处理优化导致的。已有多名用户切换到Claude或其他模型。
AI主权、开源模型与Alex Karp:企业如何保护数据护城河
AI主权、开源模型与Alex Karp
前沿AI实验室不只是出售智能,它们正在吸收你的护城河。以下是企业为何醒悟,以及实际可选方案。
0 — 概要
🔥 信号雷达
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌
行业动态 · Hacker News▲ 118
GPT-5.5 Codex 性能下降,原因可能在这里
有讨论提出,推理token聚类机制,可能是GPT-5.5 Codex性能下降的诱因。
GPT-5.5 Codex 性能下降,原因可能在这里
有讨论提出,推理token聚类机制,可能是GPT-5.5 Codex性能下降的诱因。
实战经验 · @RoundtableSpace▲ 2.3万
把Fable 5改成重型推理任务协调器
两步就能把Fable 5改成协调重型推理的工具,跟着操作就能用,不用额外重新搭建环境
把Fable 5改成重型推理任务协调器
两步就能把Fable 5改成协调重型推理的工具,跟着操作就能用,不用额外重新搭建环境
你可以把 Fable 5 变成一个负责深度推理的编排器。怎么做呢?
1. 在 claude plugin marketplace 添加 DannyMac180/fable-advisor 并安装 claude plugin fable-advisor
2. 输入 /model fable
实战经验 · @teortaxesTex▲ 806
这款叫Fabulism的AI agent,用着比Opus舒服多了
它为有状态智能体设计,会通过上下文学习进步,还能记录使用者完成的进度,比Opus的卡顿问题好用很多
这款叫Fabulism的AI agent,用着比Opus舒服多了
它为有状态智能体设计,会通过上下文学习进步,还能记录使用者完成的进度,比Opus的卡顿问题好用很多
你觉得这个Fabulism怎么样?我越来越喜欢它了,比Opus那套糟糕的反向对抗摩擦好多了。
这是一个为有状态智能体打造的AI,能通过上下文学习持续进化,而这恰恰是人类极少能做到的事。
Fable会持续记录人类获得的分数。
行业动态 · @togethercompute▲ 842
企业都在抢着用能自己掌控数据的开源模型
开源模型能让你完全掌控数据、自定义修改、拥有数据主权,现在不少企业正快速转向这类方案。
企业都在抢着用能自己掌控数据的开源模型
开源模型能让你完全掌控数据、自定义修改、拥有数据主权,现在不少企业正快速转向这类方案。
开源模型让你可以对自己的数据获得完全控制权、定制能力和所有权。
很多公司正在快速推进这件事。
@vipulved 在 @CNBC 与 @dee_bosa 一起参与了相关讨论。
实战经验 · @omarsar0▲ 4.6K
多模态提示是AI智能体交互的未来方向
作者公开了自己给编码智能体做多模态提示的实现过程,还附了视频演示,可以跟着动手实践
多模态提示是AI智能体交互的未来方向
作者公开了自己给编码智能体做多模态提示的实现过程,还附了视频演示,可以跟着动手实践
深度观点 · @cgtwts▲ 530
原来用AI越说越错?这和以前用的不一样
Fable 5一天能完成过去团队一个月的工作,它不需要太多人工指引,过度拆解解释任务反而会让结果变差。
原来用AI越说越错?这和以前用的不一样
Fable 5一天能完成过去团队一个月的工作,它不需要太多人工指引,过度拆解解释任务反而会让结果变差。
Claude Code 的创作者 Boris Cherny 表示:“Fable 5 能在一天内完成你的团队过去需要花一个月才能做完的工作。大多数人都还是会用错它。”
他在 12 分钟的分享里解释了,为什么 Fable 5 相比前代模型需要少得多的引导,以及为什么过度解释每项任务只会让结果更糟。
实战经验 · @RoundtableSpace▲ 9.5K
睡觉的时候,AI自动帮你补笔记里的知识缺口
有人给自己的Obsidian加Claude工作流,加入了自动学习功能,可以在睡觉时扫描知识缺口并自动完成调研。
睡觉的时候,AI自动帮你补笔记里的知识缺口
有人给自己的Obsidian加Claude工作流,加入了自动学习功能,可以在睡觉时扫描知识缺口并自动完成调研。
行业动态 · @petergyang▲ 1.9K
OpenAI产品经理日常用Codex干活,居然这么玩
分享OpenAI内部产品经理用Codex完成工作的实际方式,想完整了解可以明天收看这期节目
OpenAI产品经理日常用Codex干活,居然这么玩
分享OpenAI内部产品经理用Codex完成工作的实际方式,想完整了解可以明天收看这期节目
我明天播出的这期节目将会带大家深入了解,OpenAI 的产品经理是如何在产品工作中使用 Codex 的。
Codex 的产品经理 Rohan 将演示如何做到以下操作:
→ 使用 Image Gen 快速探索设计方案
→ 从 Slack 触发 Codex 自动化流程
→ 使用一个 Codex 线程管理其他线程
📌 点击订阅,明天就能收看完整节目:
新品发布 · @RoundtableSpace▲ 9.6K
提示词工程被新方法取代了?有人搞出循环工程
不用手动给每个任务写提示词,直接设计可自动运行的AI工作流,项目已包含多种可复用的工作循环
提示词工程被新方法取代了?有人搞出循环工程
不用手动给每个任务写提示词,直接设计可自动运行的AI工作流,项目已包含多种可复用的工作循环
LOOP ENGINEERING 正在取代 PROMPT ENGINEERING。
设计可自动运行的 AI 工作流,无需手动为每一项任务写提示词。
它包含可复用的循环,适用于 CI、PR、依赖项和 issue 管理。
仓库地址:
工具产品 · @Rainmaker1973▲ 1.5万
神经网络和机器学习,现在都可以可视化了
可以在这里查看神经网络和机器学习的可视化
神经网络和机器学习,现在都可以可视化了
可以在这里查看神经网络和机器学习的可视化
AI研究 · @rohanpaul_ai▲ 1.4K
卡内基梅隆大学发布Gym-Anything助力AI训练
CMU研究提出可将任意软件转化为AI智能体训练环境
卡内基梅隆大学发布Gym-Anything助力AI训练
CMU研究提出可将任意软件转化为AI智能体训练环境
智能体 · @omarsar0▲ 8.8K
研究人员提出面向智能体的多模态提示交互方法
多模态提示可提升智能体任务效率,适配多领域工作场景
研究人员提出面向智能体的多模态提示交互方法
多模态提示可提升智能体任务效率,适配多领域工作场景
工作方式 · @Michaelzsguo▲ 19
你听说吗,现在大家用AI其实都是在做AI的活
很多人以为自己在指挥AI干活,实际上做的是本该AI智能代理协调的工作,这是当下AI协作模式正在发生的转变。
你听说吗,现在大家用AI其实都是在做AI的活
很多人以为自己在指挥AI干活,实际上做的是本该AI智能代理协调的工作,这是当下AI协作模式正在发生的转变。
开源工具 · @iotcoi▲ 103
NVIDIA开源了能帮不同大模型互译的转发工具
这个叫Switchyard的工具,能在OpenAI和Anthropic的接口之间互转格式,还支持函数调用,改按需求智能路由请求了。
NVIDIA开源了能帮不同大模型互译的转发工具
这个叫Switchyard的工具,能在OpenAI和Anthropic的接口之间互转格式,还支持函数调用,改按需求智能路由请求了。
NVIDIA 开源了 Switchyard:这是一个多兼容 LLM 代理,可以在 OpenAI 和 Anthropic 的格式之间互转,就像懂「函数调用」的联合国翻译。
Token 堆料时代已经结束。它支持智能路由、强类型定义、单请求统计。你的智能代理无需签证就能跨厂商边境运行。
AI绘图 · @SD_Tutorial▲ 34
出了新的AI绘图深度控制扩展工具
这个LoRA模型用Depth-Anything-V2提取深度图,生成新图时能保留原图像的3D结构和构图,内容随便换。
出了新的AI绘图深度控制扩展工具
这个LoRA模型用Depth-Anything-V2提取深度图,生成新图时能保留原图像的3D结构和构图,内容随便换。
Krea-2☺️ Depth ControlNet LoRA
用于深度条件生成。
它先用 Depth-Anything-V2 提取深度图,再生成一张保留原有 3D 结构和构图的新图片,内容和风格可以完全按你的要求生成。👇
AI部署 · @aijoey▲ 106
有人摸出了Mac连DGX Spark跑推理的方法
这个方案专门给DGX Spark用户准备,用Mac当控制端,通过Hermes Desktop连接已经跑在DGX Spark上的推理服务。
有人摸出了Mac连DGX Spark跑推理的方法
这个方案专门给DGX Spark用户准备,用Mac当控制端,通过Hermes Desktop连接已经跑在DGX Spark上的推理服务。
这篇内容专门针对同时将 Mac 用作控制平面的 DGX Spark 用户。
解决方案:将你 Mac 上的 Hermes Desktop 连接到 DGX Spark 上已经在运行的推理服务器。
机器人 · @ErenChenAI▲ 47
国内机器人守门AI现在效果已经接近顶级门将了
Booster自研的守门员算法,让机器人扑球的水平,感觉接近顶级门将库尔图瓦的水平。
国内机器人守门AI现在效果已经接近顶级门将了
Booster自研的守门员算法,让机器人扑球的水平,感觉接近顶级门将库尔图瓦的水平。
大模型 · @micheltamanda▲ 12
本地跑AI的玩家都在说qwen3.6-27b很好用
有人在本地AI爱好者圈子里提问,大家一起聊聊这个模型到底好在哪里,很多人分享了自己的使用感受。
本地跑AI的玩家都在说qwen3.6-27b很好用
有人在本地AI爱好者圈子里提问,大家一起聊聊这个模型到底好在哪里,很多人分享了自己的使用感受。
软件工程 · @thenanyu▲ 414
多数开发者从未认真对待过代码评审工作
业内人士指出代码评审需实际运行验证把控质量
多数开发者从未认真对待过代码评审工作
业内人士指出代码评审需实际运行验证把控质量
我最近非常明确地意识到,过去几乎没人真正认真对待过代码审查。
认真指的是你会在开发环境里运行这段代码,确认它实现了既定目标,逐行阅读并且认可代码写法大体符合你自己的编码习惯。
发现bug的最佳方式是使用产品,尝试能不能把它搞崩。只靠读代码推演,你找不出大多数bug。
代码审查本身是针对架构和API设计做检查……目的是控制技术债务的增长。
行业动态 · @petergyang▲ 1.9K
OpenAI产品经理日常用Codex干活,居然这么玩
分享OpenAI内部产品经理用Codex完成工作的实际方式,想完整了解可以明天收看这期节目
OpenAI产品经理日常用Codex干活,居然这么玩
分享OpenAI内部产品经理用Codex完成工作的实际方式,想完整了解可以明天收看这期节目
我明天播出的这期节目将会带大家深入了解,OpenAI 的产品经理是如何在产品工作中使用 Codex 的。
Codex 的产品经理 Rohan 将演示如何做到以下操作:
→ 使用 Image Gen 快速探索设计方案
→ 从 Slack 触发 Codex 自动化流程
→ 使用一个 Codex 线程管理其他线程
📌 点击订阅,明天就能收看完整节目:
行业动态 · @togethercompute▲ 842
企业都在抢着用能自己掌控数据的开源模型
开源模型能让你完全掌控数据、自定义修改、拥有数据主权,现在不少企业正快速转向这类方案。
企业都在抢着用能自己掌控数据的开源模型
开源模型能让你完全掌控数据、自定义修改、拥有数据主权,现在不少企业正快速转向这类方案。
开源模型让你可以对自己的数据获得完全控制权、定制能力和所有权。
很多公司正在快速推进这件事。
@vipulved 在 @CNBC 与 @dee_bosa 一起参与了相关讨论。
工作方式 · @Michaelzsguo▲ 19
你听说吗,现在大家用AI其实都是在做AI的活
很多人以为自己在指挥AI干活,实际上做的是本该AI智能代理协调的工作,这是当下AI协作模式正在发生的转变。
你听说吗,现在大家用AI其实都是在做AI的活
很多人以为自己在指挥AI干活,实际上做的是本该AI智能代理协调的工作,这是当下AI协作模式正在发生的转变。
开源工具 · @iotcoi▲ 103
NVIDIA开源了能帮不同大模型互译的转发工具
这个叫Switchyard的工具,能在OpenAI和Anthropic的接口之间互转格式,还支持函数调用,改按需求智能路由请求了。
NVIDIA开源了能帮不同大模型互译的转发工具
这个叫Switchyard的工具,能在OpenAI和Anthropic的接口之间互转格式,还支持函数调用,改按需求智能路由请求了。
NVIDIA 开源了 Switchyard:这是一个多兼容 LLM 代理,可以在 OpenAI 和 Anthropic 的格式之间互转,就像懂「函数调用」的联合国翻译。
Token 堆料时代已经结束。它支持智能路由、强类型定义、单请求统计。你的智能代理无需签证就能跨厂商边境运行。
AI绘图 · @SD_Tutorial▲ 34
出了新的AI绘图深度控制扩展工具
这个LoRA模型用Depth-Anything-V2提取深度图,生成新图时能保留原图像的3D结构和构图,内容随便换。
出了新的AI绘图深度控制扩展工具
这个LoRA模型用Depth-Anything-V2提取深度图,生成新图时能保留原图像的3D结构和构图,内容随便换。
Krea-2☺️ Depth ControlNet LoRA
用于深度条件生成。
它先用 Depth-Anything-V2 提取深度图,再生成一张保留原有 3D 结构和构图的新图片,内容和风格可以完全按你的要求生成。👇
AI部署 · @aijoey▲ 106
有人摸出了Mac连DGX Spark跑推理的方法
这个方案专门给DGX Spark用户准备,用Mac当控制端,通过Hermes Desktop连接已经跑在DGX Spark上的推理服务。
有人摸出了Mac连DGX Spark跑推理的方法
这个方案专门给DGX Spark用户准备,用Mac当控制端,通过Hermes Desktop连接已经跑在DGX Spark上的推理服务。
这篇内容专门针对同时将 Mac 用作控制平面的 DGX Spark 用户。
解决方案:将你 Mac 上的 Hermes Desktop 连接到 DGX Spark 上已经在运行的推理服务器。
机器人 · @ErenChenAI▲ 47
国内机器人守门AI现在效果已经接近顶级门将了
Booster自研的守门员算法,让机器人扑球的水平,感觉接近顶级门将库尔图瓦的水平。
国内机器人守门AI现在效果已经接近顶级门将了
Booster自研的守门员算法,让机器人扑球的水平,感觉接近顶级门将库尔图瓦的水平。
大模型 · @micheltamanda▲ 12
本地跑AI的玩家都在说qwen3.6-27b很好用
有人在本地AI爱好者圈子里提问,大家一起聊聊这个模型到底好在哪里,很多人分享了自己的使用感受。
本地跑AI的玩家都在说qwen3.6-27b很好用
有人在本地AI爱好者圈子里提问,大家一起聊聊这个模型到底好在哪里,很多人分享了自己的使用感受。
行业动态 · Hacker News▲ 118
GPT-5.5 Codex 性能下降,原因可能在这里
有讨论提出,推理token聚类机制,可能是GPT-5.5 Codex性能下降的诱因。
GPT-5.5 Codex 性能下降,原因可能在这里
有讨论提出,推理token聚类机制,可能是GPT-5.5 Codex性能下降的诱因。
社区讨论:多数高频用户证实GPT-5.5 Codex代码生成质量确实明显下降,会间歇性输出非常愚蠢的实现,早年优秀的编码表现已经不复存在。技术用户观察到,该模型推理输出 token 会呈现在间距518左右固定值聚类的现象,卡到阈值的推理对应复杂任务出错,这个问题在旧版本几乎不存在,推测是OpenAI为了降低算力成本、优化吞吐量做批处理优化导致的。已有多名用户切换到Claude或其他模型。
实战经验 · @RoundtableSpace▲ 9.5K
睡觉的时候,AI自动帮你补笔记里的知识缺口
有人给自己的Obsidian加Claude工作流,加入了自动学习功能,可以在睡觉时扫描知识缺口并自动完成调研。
睡觉的时候,AI自动帮你补笔记里的知识缺口
有人给自己的Obsidian加Claude工作流,加入了自动学习功能,可以在睡觉时扫描知识缺口并自动完成调研。
实战经验 · @teortaxesTex▲ 806
这款叫Fabulism的AI agent,用着比Opus舒服多了
它为有状态智能体设计,会通过上下文学习进步,还能记录使用者完成的进度,比Opus的卡顿问题好用很多
这款叫Fabulism的AI agent,用着比Opus舒服多了
它为有状态智能体设计,会通过上下文学习进步,还能记录使用者完成的进度,比Opus的卡顿问题好用很多
你觉得这个Fabulism怎么样?我越来越喜欢它了,比Opus那套糟糕的反向对抗摩擦好多了。
这是一个为有状态智能体打造的AI,能通过上下文学习持续进化,而这恰恰是人类极少能做到的事。
Fable会持续记录人类获得的分数。
实战经验 · @omarsar0▲ 4.6K
多模态提示是AI智能体交互的未来方向
作者公开了自己给编码智能体做多模态提示的实现过程,还附了视频演示,可以跟着动手实践
多模态提示是AI智能体交互的未来方向
作者公开了自己给编码智能体做多模态提示的实现过程,还附了视频演示,可以跟着动手实践
实战经验 · @RoundtableSpace▲ 2.3万
把Fable 5改成重型推理任务协调器
两步就能把Fable 5改成协调重型推理的工具,跟着操作就能用,不用额外重新搭建环境
把Fable 5改成重型推理任务协调器
两步就能把Fable 5改成协调重型推理的工具,跟着操作就能用,不用额外重新搭建环境
你可以把 Fable 5 变成一个负责深度推理的编排器。怎么做呢?
1. 在 claude plugin marketplace 添加 DannyMac180/fable-advisor 并安装 claude plugin fable-advisor
2. 输入 /model fable
新品发布 · @RoundtableSpace▲ 9.6K
提示词工程被新方法取代了?有人搞出循环工程
不用手动给每个任务写提示词,直接设计可自动运行的AI工作流,项目已包含多种可复用的工作循环
提示词工程被新方法取代了?有人搞出循环工程
不用手动给每个任务写提示词,直接设计可自动运行的AI工作流,项目已包含多种可复用的工作循环
LOOP ENGINEERING 正在取代 PROMPT ENGINEERING。
设计可自动运行的 AI 工作流,无需手动为每一项任务写提示词。
它包含可复用的循环,适用于 CI、PR、依赖项和 issue 管理。
仓库地址:
深度观点 · @cgtwts▲ 530
原来用AI越说越错?这和以前用的不一样
Fable 5一天能完成过去团队一个月的工作,它不需要太多人工指引,过度拆解解释任务反而会让结果变差。
原来用AI越说越错?这和以前用的不一样
Fable 5一天能完成过去团队一个月的工作,它不需要太多人工指引,过度拆解解释任务反而会让结果变差。
Claude Code 的创作者 Boris Cherny 表示:“Fable 5 能在一天内完成你的团队过去需要花一个月才能做完的工作。大多数人都还是会用错它。”
他在 12 分钟的分享里解释了,为什么 Fable 5 相比前代模型需要少得多的引导,以及为什么过度解释每项任务只会让结果更糟。
工具产品 · @Rainmaker1973▲ 1.5万
神经网络和机器学习,现在都可以可视化了
可以在这里查看神经网络和机器学习的可视化
神经网络和机器学习,现在都可以可视化了
可以在这里查看神经网络和机器学习的可视化
智能体 · @omarsar0▲ 8.8K
研究人员提出面向智能体的多模态提示交互方法
多模态提示可提升智能体任务效率,适配多领域工作场景
研究人员提出面向智能体的多模态提示交互方法
多模态提示可提升智能体任务效率,适配多领域工作场景
AI研究 · @rohanpaul_ai▲ 1.4K
卡内基梅隆大学发布Gym-Anything助力AI训练
CMU研究提出可将任意软件转化为AI智能体训练环境
卡内基梅隆大学发布Gym-Anything助力AI训练
CMU研究提出可将任意软件转化为AI智能体训练环境
软件工程 · @thenanyu▲ 414
多数开发者从未认真对待过代码评审工作
业内人士指出代码评审需实际运行验证把控质量
多数开发者从未认真对待过代码评审工作
业内人士指出代码评审需实际运行验证把控质量
我最近非常明确地意识到,过去几乎没人真正认真对待过代码审查。
认真指的是你会在开发环境里运行这段代码,确认它实现了既定目标,逐行阅读并且认可代码写法大体符合你自己的编码习惯。
发现bug的最佳方式是使用产品,尝试能不能把它搞崩。只靠读代码推演,你找不出大多数bug。
代码审查本身是针对架构和API设计做检查……目的是控制技术债务的增长。
📖 深度解读
精选文章的中文编辑重写 · 按更新时间排列