社区讨论:多数用户反对这项默认设定,有人称遇到需要用户做关键架构决策的卡点,60秒根本来不及研究代码做出判断,默认开启且无法关闭是不考虑用户需求的粗制滥造,还有人因此要求Claude Code开源。部分用户认可这个功能,认为这是合格的默认设定。也有人提出,更好的方案是在会话结束后把需要澄清的问题和AI自行解答的结果一起列出供后续跟进,目前已有用户准备将其改为可选项提交补丁。
微软25亿美元建6000人团队,专帮大企业落地AI
微软成立了一个叫Microsoft Frontier Company的新部门,就干一件事:用自家现有的AI工具帮企业落地。这项目拿到了25亿美元投资,还配了6000名行业和工程专家。
微软商业业务CEO Judson Althoff不认“前向部署工程师”这个标签,说这组织“超越了FDE”,是“行业最大、最有能力、以结果为导向的工程组织”。微软本来就在大量财富500强企业里安插过工程师,光这一点就给了新业务不小的先发优势。
最近这类项目扎堆出现。两天前亚马逊AWS也宣布投10亿美元搞自己的AI部署合资企业,而且明说了就用FDE模式。
🔥 信号雷达
𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌
行业动态 · Hacker News▲ 53
Claude 超时60秒后会自己跳过提问继续跑
依赖Claude自动工作流的人可以留意,出现超时时,它会默认跳过用户提问自己继续往下处理
Claude 超时60秒后会自己跳过提问继续跑
依赖Claude自动工作流的人可以留意,出现超时时,它会默认跳过用户提问自己继续往下处理
行业动态 · Hacker News▲ 157
开发工具评测基准更到3.1版了
关注AI代码工具评测的开发者,可以用新版基准来测试不同工具的实际表现
开发工具评测基准更到3.1版了
关注AI代码工具评测的开发者,可以用新版基准来测试不同工具的实际表现
社区讨论:多数开发者质疑本次评测对Cursor的Composer 2.5的性能排名,评测称Composer 2.5性能接近GPT-5.5 xhigh和Claude Opus 4.8 max且价格低很多,但其他第三方测试显示它性能落后不少,有实际使用经验的用户也指出它推理能力不足,性能远达不到GPT-5.5的水平。此外评测图表把价格轴反过来设置,被多人吐槽不符合直觉,也有开发者呼吁直接展示成本性能的帕累托前沿图更直观。
行业动态 · Hacker News▲ 73
任何大模型都能看视频?开源工具做到了
不需要专门训练带视频能力的大模型,普通大模型就能处理视频内容,想尝试的人可以直接找开源项目体验
任何大模型都能看视频?开源工具做到了
不需要专门训练带视频能力的大模型,普通大模型就能处理视频内容,想尝试的人可以直接找开源项目体验
行业动态 · Hacker News▲ 136
单层Transformer就能匹敌全参数强化学习训练
更少的层数能达到同样的训练效果,意味着AI模型能大幅降低训练和运行成本
单层Transformer就能匹敌全参数强化学习训练
更少的层数能达到同样的训练效果,意味着AI模型能大幅降低训练和运行成本
社区讨论:多数参与者认同该结果符合直觉,transformer底层处理句法、分组等基础语义,高层负责输出解码,RL训练主要作用于中间层,仅保留单层做训练就能达到效果,还能大幅节省算力。也有人指出该结论理论有趣,但实践中仍存在诸多问题,还有人提出作者在训练token长度上存在不一致,结果测量存在偏差。
行业动态 · Hacker News▲ 75
用嵌入模型查不完全一样的重复代码
开发人员可以用这个命令行工具,找出代码里不重复但重复的部分,方便整理项目代码。
用嵌入模型查不完全一样的重复代码
开发人员可以用这个命令行工具,找出代码里不重复但重复的部分,方便整理项目代码。
社区讨论:开发者称该工具专门用来检测其他工具、AI和人类都难发现的相似代码,能识别除简单拷贝或小幅修改克隆外的更多相似代码,只是初步结果需要人工验证。不少开发者认可这是嵌入模型的绝佳用法,传统AST工具很难跨模块做语义代码去重,重构前做这项检测很实用。多名开发者提出技术疑问:是否可以先加确定性步骤提升效率?
是否会聚合依赖函数的嵌入?不同语言如何分块?也有人好奇有没有和BM25等简单方法做基准对比。
行业动态 · Hacker News▲ 113
依赖项里完全不带大模型代码,这是什么操作
有人公开了不依赖现成大模型代码的项目,引发开发者热议,想做定制化大模型可以参考这条路径
依赖项里完全不带大模型代码,这是什么操作
有人公开了不依赖现成大模型代码的项目,引发开发者热议,想做定制化大模型可以参考这条路径
社区讨论:多数支持该项目的开发者认为这是对低质量大模型生成代码垃圾的合理抵制,支持者调侃大模型至少不会在你指出它错了的时候找HR找你麻烦,也有人反过来偏好自己写的大模型生成代码不额外依赖其他大模型代码。实用主义者表示,该项目因此舍弃新版本git和ghc,宁可等待他人分叉项目也不会放弃主流工具,有人质疑开源项目纠结大模型代码版权时,大企业内部却毫无顾忌地随意生成代码。也有人认为不借助大模型根本无法维持开发速度,还有人肯定项目维护者的个人选择。
行业动态 · Hacker News▲ 124
OpenAI正商谈给美国政府让出5%的股份
头部AI公司的股权结构要发生变动,核心公司的决策会影响所有普通用户用到的AI服务
OpenAI正商谈给美国政府让出5%的股份
头部AI公司的股权结构要发生变动,核心公司的决策会影响所有普通用户用到的AI服务
社区讨论:多数评论者不认可该方案,有人指出政府持股后无法再对OpenAI保持中立监管,也有人认为这是OpenAI为未来获得政府纾困铺路,还有人觉得5%的占比远达不到让公众分享AI收益的目标。有人质疑政府本身有足够资源自研大模型,没必要参股私企,也有人提出相比持股,对科技股票交易征税更能给政府带来持续收入。
新品发布 · @hwchase17▲ 6.2K
自动找Agent错误还写修复方案,这个Agent做到了
这个Agent可以帮你排查自己开发的Agent故障,梳理问题优先级并生成修复代码,相关讨论被整理成了播客节目
自动找Agent错误还写修复方案,这个Agent做到了
这个Agent可以帮你排查自己开发的Agent故障,梳理问题优先级并生成修复代码,相关讨论被整理成了播客节目
这是Max Agency播客的特别一期,嘉宾是@bentannyhill。
一个月前,他的团队发布了LangSmith Engine——也就是我们用来排查你的智能体故障、排序问题优先级、起草修复方案的智能体。
我们深入探讨了架构决策:从我们如何使用沙箱,到我们如何创建子智能体。
我们还讨论了一个有趣的挑战——我们如何为一个永不停机的智能体构建评估。
点击下方查看完整对话 ⤵️
⏯️ YouTube:
🎧 Apple:
🟢 Spotify:
深度观点 · @emollick▲ 1.3万
现在布局AI,两派吵翻了,你站哪边?
X平台上关于AI落地的建议分成两派,一派觉得AI还会指数级增长,另一派认为当前能力已经到顶,该围绕现有局限和成本结构搭建业务
现在布局AI,两派吵翻了,你站哪边?
X平台上关于AI落地的建议分成两派,一派觉得AI还会指数级增长,另一派认为当前能力已经到顶,该围绕现有局限和成本结构搭建业务
我 X 信息流里的 AI 落地建议分为两派。一派是「感受到指数增长」的人。
另一派的(或许是无意识的?)AI 心智模型是:当前水平差不多就是 AI 能达到的极限了,所以现在该围绕现有能力的局限性和成本结构来搭建产品。
新品发布 · @RoundtableSpace▲ 8.7K
有人把Hermes Agent改造成了AI任务指挥台
自带语音控制、浏览器自动化、应用启动和线索获取功能,普通人也能直接用现成的整合AI工具完成多任务
有人把Hermes Agent改造成了AI任务指挥台
自带语音控制、浏览器自动化、应用启动和线索获取功能,普通人也能直接用现成的整合AI工具完成多任务
实战经验 · @emollick▲ 1.8万
Claude Code里的Fable能帮非开发者干活,但长任务不好用
想用它跑五小时以上的自主任务,没法实时看进度、中途改指令,只能等全部输出完再处理
Claude Code里的Fable能帮非开发者干活,但长任务不好用
想用它跑五小时以上的自主任务,没法实时看进度、中途改指令,只能等全部输出完再处理
Claude Code 里的 Fable 能做到非常了不起的事,对非编程用户来说也是如此,但它的界面并不是为管理5小时以上的自主任务设计的。
你很难实时观察任务进展、实时介入,通常只能等输出全部生成完才能看到。
深度观点 · @emollick▲ 1.5万
持续学习是AI大规模普及的最大障碍
现在的AI模型会遗忘新学的知识,每次都要人类帮它重新学习,AI普及的速度会被人力流程卡住,还会影响递归自我改进
持续学习是AI大规模普及的最大障碍
现在的AI模型会遗忘新学的知识,每次都要人类帮它重新学习,AI普及的速度会被人力流程卡住,还会影响递归自我改进
持续学习或许是AI大规模落地最大的障碍,它对递归自我优化也可能有重大影响。
只要你面对的还是失忆型模型,需要人类替它们完成学习,AI落地的速度就会被人类工作流程卡住。
行业动态 · Hacker News▲ 56
有人提出了一种能赢Fable的紧绳AI编码法
Hacker News上已有五十多条讨论,不少人在关注这套方法的实际效果
有人提出了一种能赢Fable的紧绳AI编码法
Hacker News上已有五十多条讨论,不少人在关注这套方法的实际效果
社区讨论:多数开发者不认可该方法,有人认为文章内容空洞,这种紧绳编码比自己写代码还慢,效率极低,也有人觉得它是偷懒的借口,本身没有给AI足够的问题细节,手把手带强模型写代码纯浪费时间。也有开发者疑问,这难道不是正经开发者用AI处理重要任务的通用做法,还有人好奇更强的模型能否通过这类引导达到更高的产出水平。
商业 · @jun_song▲ 420
企业用Claude API居然比雇工程师还贵
有人算了账,企业级Claude API的成本,比招一个全职软件工程师还要高。现在团队要做AI选型,得先算清楚这笔账
企业用Claude API居然比雇工程师还贵
有人算了账,企业级Claude API的成本,比招一个全职软件工程师还要高。现在团队要做AI选型,得先算清楚这笔账
开源 · @berryxia▲ 265
HeyGen把专业剪辑的关键帧系统开源了
它把After Effects级别的时间轴和关键帧控制做成可代码调用的工具,AI智能体现在能自己看懂生成的运动,只需要一行命令就能修复问题
HeyGen把专业剪辑的关键帧系统开源了
它把After Effects级别的时间轴和关键帧控制做成可代码调用的工具,AI智能体现在能自己看懂生成的运动,只需要一行命令就能修复问题
HeyGen把专业视频编辑里的关键帧系统开源了,叫HyperFrames Keyframes。
他们把After Effects级别的时间轴和关键帧控制做成了可代码化的东西,既适合新手,又给专业用户保留了深度控制。
更关键的是,现在你的Agent能“看到”自己生成的运动,并在一条命令里自己修复问题。
命令就一行:npx hyperframes keyframes。还能在他们的Studio里可视化编辑GSAP关键帧。
这其实是在把AI视频生成从“一次生成靠运气”推向“生成 + 可控编辑 + Agent自纠”的闭环。
把传统专业工具的底层逻辑开源出来,让Agent也能直接操作运动数据。
地址见评论区👇🏻
研究 · @_simonsmith▲ 166
AI从经验学习的性能,每三个月就翻一倍
研究者观察到,AI模型从过往经验里学习新东西的能力提升速度很快,性能每三个月就能翻倍
AI从经验学习的性能,每三个月就翻一倍
研究者观察到,AI模型从过往经验里学习新东西的能力提升速度很快,性能每三个月就能翻倍
行业动态 · @DataChaz▲ 853
连Palantir都开始支持开源大模型了
一向做定制化企业服务的Palantir公开支持开源模型,不少人觉得这是行业方向真的变了
连Palantir都开始支持开源大模型了
一向做定制化企业服务的Palantir公开支持开源模型,不少人觉得这是行业方向真的变了
开发者工具 · @icanvardar▲ 127
大语言模型读懂git比大多数开发者都好
有开发者说,大语言模型对git版本控制的理解,比大部分写代码的人都要到位,处理代码历史相关的问题会更顺畅
大语言模型读懂git比大多数开发者都好
有开发者说,大语言模型对git版本控制的理解,比大部分写代码的人都要到位,处理代码历史相关的问题会更顺畅
产品发布 · @altryne▲ 712
Sakana AI发布了单API调用的多智能体系统
新出的FUGU是完整的多AI智能体调度系统,只需要通过一个模型API就能调用
Sakana AI发布了单API调用的多智能体系统
新出的FUGU是完整的多AI智能体调度系统,只需要通过一个模型API就能调用
刚刚 @SakanaAILabs 发布了 FUGU,这是一套完整的多智能体编排系统,可通过单一模型 API 调用使用。
接下来在 @thursdai_pod,@Stefania_druga 将从 @aiDotEngineer 世博会现场连线,和我们直播交流。
点击下方就能收听!
新品发布 · @LangChain▲ 4.5K
LangChain 公开了 LangSmith Engine 的建造过程
想了解 LangSmith Engine 是如何被打造出来的,可以看看
LangChain 公开了 LangSmith Engine 的建造过程
想了解 LangSmith Engine 是如何被打造出来的,可以看看
行业动态 · @altryne▲ 768
OpenAI开发者聊前沿AI,刚聊完本地部署
对本地AI部署感兴趣,可以看这场和OpenAI开发者的对谈,接下来会聊前沿AI方向。
OpenAI开发者聊前沿AI,刚聊完本地部署
对本地AI部署感兴趣,可以看这场和OpenAI开发者的对谈,接下来会聊前沿AI方向。
深度观点 · @LiorOnAI▲ 3.2K
微软专门培训六千人帮企业装AI,问题出在哪
买了AI许可证,生产力没提上来,项目永远卡在内测阶段。AI本身没问题,卡在乱数据、旧流程和没人牵头落地。
微软专门培训六千人帮企业装AI,问题出在哪
买了AI许可证,生产力没提上来,项目永远卡在内测阶段。AI本身没问题,卡在乱数据、旧流程和没人牵头落地。
微软培训6000人,帮助企业部署AI,这件事告诉你,真正的问题不在AI本身。问题在于企业根本不知道该怎么用AI。
所有人都以为,只要买下Copilot授权,生产力就会自动提升。结果并没有发生。企业困在小规模试点测试里,项目始终没有规模化推广。
AI本身运行得很好。真正的问题是杂乱的企业数据、老旧的工作流程,以及没有人牵头负责落地推广。
所以微软现在做了IBM和SAP几十年前做过的事:搭建一支庞大的咨询团队,亲自推动AI落地 adoption。
深度观点 · @omarsar0▲ 2.2K
AI自主权不是可选项,开源模型是核心
看重核心竞争优势的个人、组织和国家,都需要把开源模型纳入AI战略,守住自己的核心优势。
AI自主权不是可选项,开源模型是核心
看重核心竞争优势的个人、组织和国家,都需要把开源模型纳入AI战略,守住自己的核心优势。
行业动态 · @TechCrunch▲ 7.0K
扎克伯格承认:AI智能体进度比预期慢
Meta创始人扎克伯格对内告知员工,AI智能体的发展进度没有达到他原本预期。
扎克伯格承认:AI智能体进度比预期慢
Meta创始人扎克伯格对内告知员工,AI智能体的发展进度没有达到他原本预期。
行业动态 · @altryne▲ 5.2K
AI工程师博览会开幕,OpenAI等大厂都来了
多家头部AI机构参与现场直播活动,可以在线观看各团队的最新分享内容
AI工程师博览会开幕,OpenAI等大厂都来了
多家头部AI机构参与现场直播活动,可以在线观看各团队的最新分享内容
工具产品 · @omarsar0▲ 5.5K
这个工具能自动更感兴趣AI领域的综述论文
不用手动整理追踪领域最新综述,省出的时间可以放在读论文做研究上
这个工具能自动更感兴趣AI领域的综述论文
不用手动整理追踪领域最新综述,省出的时间可以放在读论文做研究上
新闻 · @Scobleizer▲ 669
开发者升级新闻站AI脚本 基于NotebookLM生成AI资讯播客
开发者用AI代理每日抓取X平台AI圈内容,升级NotebookLM新闻脚本
开发者升级新闻站AI脚本 基于NotebookLM生成AI资讯播客
开发者用AI代理每日抓取X平台AI圈内容,升级NotebookLM新闻脚本
大语言模型 · @fofrAI▲ 1.4K
用户分享与AI代理交流时意外学会压缩提示词
博主称与AI代理交流越多,越会压缩意图Token,意外习得Claude式提示
用户分享与AI代理交流时意外学会压缩提示词
博主称与AI代理交流越多,越会压缩意图Token,意外习得Claude式提示
大模型 · @kunchenguid▲ 511
开发者分享Claude三款大模型使用场景划分思路
开发者分享Fable、Opus、Sonnet的分层使用心智模型
开发者分享Claude三款大模型使用场景划分思路
开发者分享Fable、Opus、Sonnet的分层使用心智模型
这是我关于何时使用 Fable/Opus/Sonnet 的新思考模型:我主要用 Fable 来解决“我应该做什么产品”这个问题。
这类战略性问题要求最高的智能和判断力。当 GPT 5.6 发布后,它应该也会成为我处理这类问题的另一个选择。
我用 Opus 来规划“该怎么做”。复杂的技术规划会消耗大量 tokens,因为它需要在海量上下文里梳理信息。
但当“做什么”已经被 Fable 明确后,“怎么做”往往不是最难的部分,不值得一直用 Fable,但这件事 Sonnet 又没办法一直做好。Opus 和 GPT 5.5 在这里刚刚好。
我用 Sonnet 来实际完成开发。当需求和技术方案都已经明确后,Sonnet 5 完全有能力完成实现,而且相比 Fable/Opus 能省下很多成本。
现在随着 Fable 层级的模型加入进来,token 效率变得越来越关键。我很快会分享更多我管理这件事的方法!
苹果 · @PatrickToulme▲ 523
分析师解读苹果低资本开支AI战略已初见成效
分析人士认为苹果不大规模投入AI资本开支的策略正获得回报
分析师解读苹果低资本开支AI战略已初见成效
分析人士认为苹果不大规模投入AI资本开支的策略正获得回报
我一直在思考 Apple 的 AI 战略。他们不斥巨资投入 AI 资本支出的战略,似乎正在收到成效。
在 GLM 5.2 发布以及整体开源模型发展中,Apple 是最大的赢家之一。$AAPL。我的推理如下:
1. 开源模型就是基础。它们免费可得。现在 GLM 5.2 已经开源,并且达到了 Opus 级质量。这意味着 Apple 现在可以免费获得一个 MIT 许可证的 Claude Opus 级模型,而且完全不用自己花钱开发。
2. 如果 Apple 从零开始开发一个 GLM 5.2 质量的模型,需要投入非常高的资本支出,如果过去几年他们要一直参与前沿 AI 竞赛,支出就更高了。他们省下了这笔资本支出,还免费得到了一个 Opus 级模型。
3. Apple 可以直接拿来 GLM 5.2 这类开源模型,用自己的数据针对自身使用场景做微调后训练。这所需的资本支出非常少。
通过静观其变、不参与资本支出竞赛,Apple 实际上现在已经和那些投入了巨额资本支出的公司处在同一位置,而那些公司的模型也没能打败开源模型。耐心似乎得到了回报。
新品发布 · @RoundtableSpace▲ 8.7K
有人把Hermes Agent改造成了AI任务指挥台
自带语音控制、浏览器自动化、应用启动和线索获取功能,普通人也能直接用现成的整合AI工具完成多任务
有人把Hermes Agent改造成了AI任务指挥台
自带语音控制、浏览器自动化、应用启动和线索获取功能,普通人也能直接用现成的整合AI工具完成多任务
新品发布 · @hwchase17▲ 6.2K
自动找Agent错误还写修复方案,这个Agent做到了
这个Agent可以帮你排查自己开发的Agent故障,梳理问题优先级并生成修复代码,相关讨论被整理成了播客节目
自动找Agent错误还写修复方案,这个Agent做到了
这个Agent可以帮你排查自己开发的Agent故障,梳理问题优先级并生成修复代码,相关讨论被整理成了播客节目
这是Max Agency播客的特别一期,嘉宾是@bentannyhill。
一个月前,他的团队发布了LangSmith Engine——也就是我们用来排查你的智能体故障、排序问题优先级、起草修复方案的智能体。
我们深入探讨了架构决策:从我们如何使用沙箱,到我们如何创建子智能体。
我们还讨论了一个有趣的挑战——我们如何为一个永不停机的智能体构建评估。
点击下方查看完整对话 ⤵️
⏯️ YouTube:
🎧 Apple:
🟢 Spotify:
新品发布 · @LangChain▲ 4.5K
LangChain 公开了 LangSmith Engine 的建造过程
想了解 LangSmith Engine 是如何被打造出来的,可以看看
LangChain 公开了 LangSmith Engine 的建造过程
想了解 LangSmith Engine 是如何被打造出来的,可以看看
行业动态 · @altryne▲ 5.2K
AI工程师博览会开幕,OpenAI等大厂都来了
多家头部AI机构参与现场直播活动,可以在线观看各团队的最新分享内容
AI工程师博览会开幕,OpenAI等大厂都来了
多家头部AI机构参与现场直播活动,可以在线观看各团队的最新分享内容
行业动态 · @TechCrunch▲ 7.0K
扎克伯格承认:AI智能体进度比预期慢
Meta创始人扎克伯格对内告知员工,AI智能体的发展进度没有达到他原本预期。
扎克伯格承认:AI智能体进度比预期慢
Meta创始人扎克伯格对内告知员工,AI智能体的发展进度没有达到他原本预期。
行业动态 · @altryne▲ 768
OpenAI开发者聊前沿AI,刚聊完本地部署
对本地AI部署感兴趣,可以看这场和OpenAI开发者的对谈,接下来会聊前沿AI方向。
OpenAI开发者聊前沿AI,刚聊完本地部署
对本地AI部署感兴趣,可以看这场和OpenAI开发者的对谈,接下来会聊前沿AI方向。
商业 · @jun_song▲ 420
企业用Claude API居然比雇工程师还贵
有人算了账,企业级Claude API的成本,比招一个全职软件工程师还要高。现在团队要做AI选型,得先算清楚这笔账
企业用Claude API居然比雇工程师还贵
有人算了账,企业级Claude API的成本,比招一个全职软件工程师还要高。现在团队要做AI选型,得先算清楚这笔账
开源 · @berryxia▲ 265
HeyGen把专业剪辑的关键帧系统开源了
它把After Effects级别的时间轴和关键帧控制做成可代码调用的工具,AI智能体现在能自己看懂生成的运动,只需要一行命令就能修复问题
HeyGen把专业剪辑的关键帧系统开源了
它把After Effects级别的时间轴和关键帧控制做成可代码调用的工具,AI智能体现在能自己看懂生成的运动,只需要一行命令就能修复问题
HeyGen把专业视频编辑里的关键帧系统开源了,叫HyperFrames Keyframes。
他们把After Effects级别的时间轴和关键帧控制做成了可代码化的东西,既适合新手,又给专业用户保留了深度控制。
更关键的是,现在你的Agent能“看到”自己生成的运动,并在一条命令里自己修复问题。
命令就一行:npx hyperframes keyframes。还能在他们的Studio里可视化编辑GSAP关键帧。
这其实是在把AI视频生成从“一次生成靠运气”推向“生成 + 可控编辑 + Agent自纠”的闭环。
把传统专业工具的底层逻辑开源出来,让Agent也能直接操作运动数据。
地址见评论区👇🏻
研究 · @_simonsmith▲ 166
AI从经验学习的性能,每三个月就翻一倍
研究者观察到,AI模型从过往经验里学习新东西的能力提升速度很快,性能每三个月就能翻倍
AI从经验学习的性能,每三个月就翻一倍
研究者观察到,AI模型从过往经验里学习新东西的能力提升速度很快,性能每三个月就能翻倍
行业动态 · @DataChaz▲ 853
连Palantir都开始支持开源大模型了
一向做定制化企业服务的Palantir公开支持开源模型,不少人觉得这是行业方向真的变了
连Palantir都开始支持开源大模型了
一向做定制化企业服务的Palantir公开支持开源模型,不少人觉得这是行业方向真的变了
开发者工具 · @icanvardar▲ 127
大语言模型读懂git比大多数开发者都好
有开发者说,大语言模型对git版本控制的理解,比大部分写代码的人都要到位,处理代码历史相关的问题会更顺畅
大语言模型读懂git比大多数开发者都好
有开发者说,大语言模型对git版本控制的理解,比大部分写代码的人都要到位,处理代码历史相关的问题会更顺畅
产品发布 · @altryne▲ 712
Sakana AI发布了单API调用的多智能体系统
新出的FUGU是完整的多AI智能体调度系统,只需要通过一个模型API就能调用
Sakana AI发布了单API调用的多智能体系统
新出的FUGU是完整的多AI智能体调度系统,只需要通过一个模型API就能调用
刚刚 @SakanaAILabs 发布了 FUGU,这是一套完整的多智能体编排系统,可通过单一模型 API 调用使用。
接下来在 @thursdai_pod,@Stefania_druga 将从 @aiDotEngineer 世博会现场连线,和我们直播交流。
点击下方就能收听!
行业动态 · Hacker News▲ 124
OpenAI正商谈给美国政府让出5%的股份
头部AI公司的股权结构要发生变动,核心公司的决策会影响所有普通用户用到的AI服务
OpenAI正商谈给美国政府让出5%的股份
头部AI公司的股权结构要发生变动,核心公司的决策会影响所有普通用户用到的AI服务
社区讨论:多数评论者不认可该方案,有人指出政府持股后无法再对OpenAI保持中立监管,也有人认为这是OpenAI为未来获得政府纾困铺路,还有人觉得5%的占比远达不到让公众分享AI收益的目标。有人质疑政府本身有足够资源自研大模型,没必要参股私企,也有人提出相比持股,对科技股票交易征税更能给政府带来持续收入。
行业动态 · Hacker News▲ 113
依赖项里完全不带大模型代码,这是什么操作
有人公开了不依赖现成大模型代码的项目,引发开发者热议,想做定制化大模型可以参考这条路径
依赖项里完全不带大模型代码,这是什么操作
有人公开了不依赖现成大模型代码的项目,引发开发者热议,想做定制化大模型可以参考这条路径
社区讨论:多数支持该项目的开发者认为这是对低质量大模型生成代码垃圾的合理抵制,支持者调侃大模型至少不会在你指出它错了的时候找HR找你麻烦,也有人反过来偏好自己写的大模型生成代码不额外依赖其他大模型代码。实用主义者表示,该项目因此舍弃新版本git和ghc,宁可等待他人分叉项目也不会放弃主流工具,有人质疑开源项目纠结大模型代码版权时,大企业内部却毫无顾忌地随意生成代码。也有人认为不借助大模型根本无法维持开发速度,还有人肯定项目维护者的个人选择。
行业动态 · Hacker News▲ 75
用嵌入模型查不完全一样的重复代码
开发人员可以用这个命令行工具,找出代码里不重复但重复的部分,方便整理项目代码。
用嵌入模型查不完全一样的重复代码
开发人员可以用这个命令行工具,找出代码里不重复但重复的部分,方便整理项目代码。
社区讨论:开发者称该工具专门用来检测其他工具、AI和人类都难发现的相似代码,能识别除简单拷贝或小幅修改克隆外的更多相似代码,只是初步结果需要人工验证。不少开发者认可这是嵌入模型的绝佳用法,传统AST工具很难跨模块做语义代码去重,重构前做这项检测很实用。多名开发者提出技术疑问:是否可以先加确定性步骤提升效率?
是否会聚合依赖函数的嵌入?不同语言如何分块?也有人好奇有没有和BM25等简单方法做基准对比。
行业动态 · Hacker News▲ 56
有人提出了一种能赢Fable的紧绳AI编码法
Hacker News上已有五十多条讨论,不少人在关注这套方法的实际效果
有人提出了一种能赢Fable的紧绳AI编码法
Hacker News上已有五十多条讨论,不少人在关注这套方法的实际效果
社区讨论:多数开发者不认可该方法,有人认为文章内容空洞,这种紧绳编码比自己写代码还慢,效率极低,也有人觉得它是偷懒的借口,本身没有给AI足够的问题细节,手把手带强模型写代码纯浪费时间。也有开发者疑问,这难道不是正经开发者用AI处理重要任务的通用做法,还有人好奇更强的模型能否通过这类引导达到更高的产出水平。
行业动态 · Hacker News▲ 136
单层Transformer就能匹敌全参数强化学习训练
更少的层数能达到同样的训练效果,意味着AI模型能大幅降低训练和运行成本
单层Transformer就能匹敌全参数强化学习训练
更少的层数能达到同样的训练效果,意味着AI模型能大幅降低训练和运行成本
社区讨论:多数参与者认同该结果符合直觉,transformer底层处理句法、分组等基础语义,高层负责输出解码,RL训练主要作用于中间层,仅保留单层做训练就能达到效果,还能大幅节省算力。也有人指出该结论理论有趣,但实践中仍存在诸多问题,还有人提出作者在训练token长度上存在不一致,结果测量存在偏差。
行业动态 · Hacker News▲ 73
任何大模型都能看视频?开源工具做到了
不需要专门训练带视频能力的大模型,普通大模型就能处理视频内容,想尝试的人可以直接找开源项目体验
任何大模型都能看视频?开源工具做到了
不需要专门训练带视频能力的大模型,普通大模型就能处理视频内容,想尝试的人可以直接找开源项目体验
行业动态 · Hacker News▲ 157
开发工具评测基准更到3.1版了
关注AI代码工具评测的开发者,可以用新版基准来测试不同工具的实际表现
开发工具评测基准更到3.1版了
关注AI代码工具评测的开发者,可以用新版基准来测试不同工具的实际表现
社区讨论:多数开发者质疑本次评测对Cursor的Composer 2.5的性能排名,评测称Composer 2.5性能接近GPT-5.5 xhigh和Claude Opus 4.8 max且价格低很多,但其他第三方测试显示它性能落后不少,有实际使用经验的用户也指出它推理能力不足,性能远达不到GPT-5.5的水平。此外评测图表把价格轴反过来设置,被多人吐槽不符合直觉,也有开发者呼吁直接展示成本性能的帕累托前沿图更直观。
行业动态 · Hacker News▲ 53
Claude 超时60秒后会自己跳过提问继续跑
依赖Claude自动工作流的人可以留意,出现超时时,它会默认跳过用户提问自己继续往下处理
Claude 超时60秒后会自己跳过提问继续跑
依赖Claude自动工作流的人可以留意,出现超时时,它会默认跳过用户提问自己继续往下处理
社区讨论:多数用户反对这项默认设定,有人称遇到需要用户做关键架构决策的卡点,60秒根本来不及研究代码做出判断,默认开启且无法关闭是不考虑用户需求的粗制滥造,还有人因此要求Claude Code开源。部分用户认可这个功能,认为这是合格的默认设定。也有人提出,更好的方案是在会话结束后把需要澄清的问题和AI自行解答的结果一起列出供后续跟进,目前已有用户准备将其改为可选项提交补丁。
深度观点 · @emollick▲ 1.5万
持续学习是AI大规模普及的最大障碍
现在的AI模型会遗忘新学的知识,每次都要人类帮它重新学习,AI普及的速度会被人力流程卡住,还会影响递归自我改进
持续学习是AI大规模普及的最大障碍
现在的AI模型会遗忘新学的知识,每次都要人类帮它重新学习,AI普及的速度会被人力流程卡住,还会影响递归自我改进
持续学习或许是AI大规模落地最大的障碍,它对递归自我优化也可能有重大影响。
只要你面对的还是失忆型模型,需要人类替它们完成学习,AI落地的速度就会被人类工作流程卡住。
深度观点 · @emollick▲ 1.3万
现在布局AI,两派吵翻了,你站哪边?
X平台上关于AI落地的建议分成两派,一派觉得AI还会指数级增长,另一派认为当前能力已经到顶,该围绕现有局限和成本结构搭建业务
现在布局AI,两派吵翻了,你站哪边?
X平台上关于AI落地的建议分成两派,一派觉得AI还会指数级增长,另一派认为当前能力已经到顶,该围绕现有局限和成本结构搭建业务
我 X 信息流里的 AI 落地建议分为两派。一派是「感受到指数增长」的人。
另一派的(或许是无意识的?)AI 心智模型是:当前水平差不多就是 AI 能达到的极限了,所以现在该围绕现有能力的局限性和成本结构来搭建产品。
深度观点 · @omarsar0▲ 2.2K
AI自主权不是可选项,开源模型是核心
看重核心竞争优势的个人、组织和国家,都需要把开源模型纳入AI战略,守住自己的核心优势。
AI自主权不是可选项,开源模型是核心
看重核心竞争优势的个人、组织和国家,都需要把开源模型纳入AI战略,守住自己的核心优势。
深度观点 · @LiorOnAI▲ 3.2K
微软专门培训六千人帮企业装AI,问题出在哪
买了AI许可证,生产力没提上来,项目永远卡在内测阶段。AI本身没问题,卡在乱数据、旧流程和没人牵头落地。
微软专门培训六千人帮企业装AI,问题出在哪
买了AI许可证,生产力没提上来,项目永远卡在内测阶段。AI本身没问题,卡在乱数据、旧流程和没人牵头落地。
微软培训6000人,帮助企业部署AI,这件事告诉你,真正的问题不在AI本身。问题在于企业根本不知道该怎么用AI。
所有人都以为,只要买下Copilot授权,生产力就会自动提升。结果并没有发生。企业困在小规模试点测试里,项目始终没有规模化推广。
AI本身运行得很好。真正的问题是杂乱的企业数据、老旧的工作流程,以及没有人牵头负责落地推广。
所以微软现在做了IBM和SAP几十年前做过的事:搭建一支庞大的咨询团队,亲自推动AI落地 adoption。
工具产品 · @omarsar0▲ 5.5K
这个工具能自动更感兴趣AI领域的综述论文
不用手动整理追踪领域最新综述,省出的时间可以放在读论文做研究上
这个工具能自动更感兴趣AI领域的综述论文
不用手动整理追踪领域最新综述,省出的时间可以放在读论文做研究上
实战经验 · @emollick▲ 1.8万
Claude Code里的Fable能帮非开发者干活,但长任务不好用
想用它跑五小时以上的自主任务,没法实时看进度、中途改指令,只能等全部输出完再处理
Claude Code里的Fable能帮非开发者干活,但长任务不好用
想用它跑五小时以上的自主任务,没法实时看进度、中途改指令,只能等全部输出完再处理
Claude Code 里的 Fable 能做到非常了不起的事,对非编程用户来说也是如此,但它的界面并不是为管理5小时以上的自主任务设计的。
你很难实时观察任务进展、实时介入,通常只能等输出全部生成完才能看到。
苹果 · @PatrickToulme▲ 523
分析师解读苹果低资本开支AI战略已初见成效
分析人士认为苹果不大规模投入AI资本开支的策略正获得回报
分析师解读苹果低资本开支AI战略已初见成效
分析人士认为苹果不大规模投入AI资本开支的策略正获得回报
我一直在思考 Apple 的 AI 战略。他们不斥巨资投入 AI 资本支出的战略,似乎正在收到成效。
在 GLM 5.2 发布以及整体开源模型发展中,Apple 是最大的赢家之一。$AAPL。我的推理如下:
1. 开源模型就是基础。它们免费可得。现在 GLM 5.2 已经开源,并且达到了 Opus 级质量。这意味着 Apple 现在可以免费获得一个 MIT 许可证的 Claude Opus 级模型,而且完全不用自己花钱开发。
2. 如果 Apple 从零开始开发一个 GLM 5.2 质量的模型,需要投入非常高的资本支出,如果过去几年他们要一直参与前沿 AI 竞赛,支出就更高了。他们省下了这笔资本支出,还免费得到了一个 Opus 级模型。
3. Apple 可以直接拿来 GLM 5.2 这类开源模型,用自己的数据针对自身使用场景做微调后训练。这所需的资本支出非常少。
通过静观其变、不参与资本支出竞赛,Apple 实际上现在已经和那些投入了巨额资本支出的公司处在同一位置,而那些公司的模型也没能打败开源模型。耐心似乎得到了回报。
大模型 · @kunchenguid▲ 511
开发者分享Claude三款大模型使用场景划分思路
开发者分享Fable、Opus、Sonnet的分层使用心智模型
开发者分享Claude三款大模型使用场景划分思路
开发者分享Fable、Opus、Sonnet的分层使用心智模型
这是我关于何时使用 Fable/Opus/Sonnet 的新思考模型:我主要用 Fable 来解决“我应该做什么产品”这个问题。
这类战略性问题要求最高的智能和判断力。当 GPT 5.6 发布后,它应该也会成为我处理这类问题的另一个选择。
我用 Opus 来规划“该怎么做”。复杂的技术规划会消耗大量 tokens,因为它需要在海量上下文里梳理信息。
但当“做什么”已经被 Fable 明确后,“怎么做”往往不是最难的部分,不值得一直用 Fable,但这件事 Sonnet 又没办法一直做好。Opus 和 GPT 5.5 在这里刚刚好。
我用 Sonnet 来实际完成开发。当需求和技术方案都已经明确后,Sonnet 5 完全有能力完成实现,而且相比 Fable/Opus 能省下很多成本。
现在随着 Fable 层级的模型加入进来,token 效率变得越来越关键。我很快会分享更多我管理这件事的方法!
大语言模型 · @fofrAI▲ 1.4K
用户分享与AI代理交流时意外学会压缩提示词
博主称与AI代理交流越多,越会压缩意图Token,意外习得Claude式提示
用户分享与AI代理交流时意外学会压缩提示词
博主称与AI代理交流越多,越会压缩意图Token,意外习得Claude式提示
新闻 · @Scobleizer▲ 669
开发者升级新闻站AI脚本 基于NotebookLM生成AI资讯播客
开发者用AI代理每日抓取X平台AI圈内容,升级NotebookLM新闻脚本
开发者升级新闻站AI脚本 基于NotebookLM生成AI资讯播客
开发者用AI代理每日抓取X平台AI圈内容,升级NotebookLM新闻脚本
📖 深度解读
精选文章的中文编辑重写 · 按更新时间排列