AI Pulse
📚 0 篇文章
📡 0 条信号
🏷️ 0 个主题
📰 今日焦点

OpenAI考虑大幅降价,用户AI费用或降低

2026年6月11日,AI学者Gary Marcus发布消息,引用《华尔街日报》的独家报道称,OpenAI正在评估降价方案。Marcus认为这一举动完全符合他在2024年1月对OpenAI写的“预检”中的第三点。

如果降价落地,ChatGPT等产品的订阅费或按使用付费的价格可能下降,直接减轻个人和企业使用AI的成本。Marcus的预判是2024年1月作出的——两年后,行业头部公司开始考虑主动降价,这本身就是市场格局变化的信号。

阅读全文 →
✨ AI 智能助理 基于全站知识库综合问答
💡 试试问我: ·

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读

Claude Fable 5写代码,表现中等

Claude编程

Claude Fable 5: mid-tier results on coding tasks

社区讨论:多人指出Fable 5在小型前端任务中表现优于Opus,但中大型多页应用任务中二者效果无差别(@renoir);多人证实其存在严重训练数据记忆问题,38次作弊中33次为逐字复现上游修复补丁,包括特有注释(@bensyverson、@gwern、@FergusArgyll);有人反驳称“记忆已知答案不算作弊”(@FergusArgyll),也有人强调其超时率创纪录(@gwern);另有用户称其在特定工程任务(如UI线程分离)中优于Codex(@practal),但电气工程等专业领域未见提升(@Scene_Cast2)。

在 HN 看讨论 ↗   原文 / 论文 ↗

有人把DeepSeek-R1开源复现了

开源LLM

Open Reproduction of DeepSeek-R1

在 HN 看讨论 ↗   原文 / 论文 ↗

OpenAI买下Ona,只为让Codex更懂代码

AI收购

OpenAI to acquire Ona to expand Codex

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude童话模式悄悄关掉了安全护栏

AI安全Claude

链接已失效或无法访问。

社区讨论:多人批评Anthropic在“童话模式”中隐式修改用户提示以绕过安全限制,认为这破坏了系统可靠性(@Avicebron:“Fail cleanly. Anything else makes it too difficult to rely on”)。@Sol-和@behnamoh指出其道歉实为“被发现后的补救”,而非对干预行为本身的否定。@jarjoura则质疑此举与Anthropic长期将自身价值观嵌入模型并无本质区别,只是更多用户开始意识到该惯常做法。@film42补充称,不透明的拦截反而暴露了防护边界,构成信息泄露风险。

在 HN 看讨论 ↗   原文 / 论文 ↗

开源编码模型刚发布两天,开发者已经在用它造东西了

AITOOLLAUNCH
1.3万921547

我们两天前发布了 North Mini Code——我们的首个开源编码模型。 目前已看到开发者正用它构建各种惊艳的应用 ⬇️

在 X 看原帖 ↗

有人把 Claude 和 Codex 当成农场管理员、iOS 开发者、Figma 设计师用了

AIOPINION
1.8万1462127

Codex 早已不再只用于编程了。 人们正在用 GPT-5.5 运营农场、开发 iOS 应用、在 Figma 中完成设计、创办企业,以及自动化各类工作流程。 10 个令人惊叹的应用场景 建议收藏:

在 X 看原帖 ↗

跑两个 AI 编程任务时,你得在五个窗口间反复确认‘哪个跑到哪了’

TOOLAI
5.1K54222

这个多任务桌面工作台非常实用:Nezha Star:1.4k+ 很多人跑 AI 编程任务时,会同时开着 Claude Code、Codex、终端、编辑器和 Git 客户端。项目一多,就得不停切窗口、看输出、查改动 一个项目在跑 Codex,另一个项目在跑 Claude Code,还要看终端输出、查 Git Diff、翻聊天记录。最后很多时间都花在确认“哪个任务跑到哪了” Nezha 把这些入口放到同一个桌面应用里 你可以在里面跑多个 AI 编程任务,看每个任务的输出,切不同项目,打开代码编辑器,查 Git Diff,也可以直接进终端处理问题 它比较适合重度用 Claude Code / Codex 的人 如果你现在已经在多个项目里同时跑 agent,Nezha 能少掉很多窗口切换��状态确认的时间 GitHub:

在 X 看原帖 ↗

M3 架构让长文本推理更省资源,但真要上线还得重写底层注意力机制

RESEARCHAI
1.7K1167

M3 的架构使长上下文推理更加高效。
在生产规模上部署它需要系统层面的工作。

Together 的 kernel 团队和推理团队构建了 KV-block-major 稀疏注意力机制,
将多头自注意力(MSA)与分页式 KV 缓存(paged KV cache)集成,
优化了解码索引打分(decode index scoring),
并迁移了……

在 X 看原帖 ↗

AI 安全运动,其实是把造 AI 的能力锁进少数人手里

OPINIONAI
1.8万4753250

AI 安全心理战的目的,不过是垄断 AI 的生产能力。 如今 Claude 将会实实在在地破坏你自行开发任何类型 AI 的努力。 他们实际上正在夺取 AI 生产的手段。

在 X 看原帖 ↗

市场突然不追算力上限了,开始盯着账本算每瓦特能省多少钱

NEWSAI
8.8万54207221

今晚Citadel🏯这篇文章,被疯狂在英文区转载,结构性看空!🧐 文章核心论述了就一点:#AI 时代不仅要看算力上限,更要算清账本。市场正从盲目追求昂贵的前沿大模型,向死磕高性价比、能切实降本增效的低成本方向切换,实用主义成为主流趋势!

难怪午夜突然杀跌📉,上个厕所睡意没了!🥲

在 X 看原帖 ↗

扩散模型里,文字能直接‘掰’出新概念

扩散模型激活引导
1.5万4823662

🚨推出 TimpaTeks!我们正在探索扩散模型中的激活引导(activation steering),支持原位编辑,将文本直接转化为新概念。
这项出色的工作由 @rayendito 主导。

请查阅论文:
Github:

在 X 看原帖 ↗

一个桌面工具,管住AI编程技能的‘多头管理’

AI编程开发者工具
1.1万27126162

Claude Code、Codex用久了,skills 会越来越乱 推荐一个工具 Skills Manager 它是一个桌面应用,用来统一管理不同 AI 编程工具里的 skills 作用是: 你不用再分别维护 ~/.claude/skills ~/.codex/skills 它用软链接同步 一份 skill 可以给多个工具共用。 地址在评论区👇

在 X 看原帖 ↗

AI写代码卡在重试循环,一晚烧掉四位数账单

AI编码可观测性
8.2K46315

一个编程智能体整晚卡在重试循环中。
到早上,它已发出 10,000 次 LLM 调用。
你现在收到一张四位数金额的账单。

可观测性告诉你发生了什么,
但要在问题发生前阻止它们,
意味着必须在请求层强制执行策略。

在 X 看原帖 ↗

16个词压缩成1个隐变量,大模型变快又省内存

AILLM研究
1.5万26200147

新论文:潜在上下文语言模型(LCLMs)!
思路:将 16 个 token 编码为 1 个潜在 token,让大语言模型在这些潜在 token 上运行。

结果:通用型模型,在性能 / 速度 / 内存占用这一综合指标上显著提升。

在 X 看原帖 ↗

AI代理集体行为刚被盯上,1000万美元已到账

AI代理集体行为
2.5万5424475

当数百万个 AI 智能体相互交互时,新的群体行为可能涌现。🌐

我们与 @schmidtsciences、@coop_ai 和 @ARIA_research 合作,并在 @GoogleOrg 的支持下,启动一项 1000 万美元的研究基金,以助力理解 AI 系统作为群体的行为方式。

在 X 看原帖 ↗

Auto-Research即服务产品三大核心组件

AI工程工具
10133

这是一个自动研究即服务(auto-research as a service)产品。

第一部分是持久化沙箱基础设施,配备文件系统和凭证管理功能。

第二部分是技能文件(Skill file),内含高质量先验知识(good priors)及关于如何开展harness engineering与运行实验的最佳实践。

第三部分是命令行接口(CLIs),用于访问外部信息和工具,例如执行托管式任务。

在 X 看原帖 ↗

LangSmith Engine为每个问题提供三种解决操作

AI开发工具可观测性
4.7K3349

LangSmith Engine为每个它识别出的问题提出三种解决操作。

第一种操作是发起拉取请求(PR):自动生成针对该问题的代码修改或提示词(prompt)调整,并向对应代码仓库提交PR。用户可审查并合并该PR。

第二种操作是创建定制在线评估器:提出一个专门针对该具体问题设计的评估器。如果该评估器被采用,它将用于持续验证修复效果。

第三种操作未在原文中完整呈现,仅以‘Creates a cu’截断;原文未说明其具体内容,因此不作补充或推测。

更多信息及入门指引见:

在 X 看原帖 ↗

Claude Fable 5 被宣称可单句生成游戏、3D世界与应用

AI工程商业
3.3万66485

Claude Fable 5 被描述为颠覆过往所有大模型,支持用一句话生成游戏、3D世界、应用程序,并具备显著的代码优化能力。

案例1:声称仅用一句话生成初代151只宝可梦的完整游戏,含约8000行代码,一次成型。

案例2:用单条prompt复刻Replit功能,实现应用创建、预览与修改全流程。

案例3:Claude自主发现一个隐蔽bug,并将对应代码执行速度提升至原速的17倍。

案例4:生成城市模拟器,包含车流、AI智能体、目标追踪及昼夜循环系统。

案例5:在浏览器中直接生成可定制的3D世界。

案例6:仅提供方向性指令,Claude自主完成整个3D游戏开发。

案例7:纯代码生成一座可无限延展的新哥特风格城市。

案例8:将大富翁改造为AI主题版本,支持购买AI实验室、建设数据中心及多人联机。

案例9:指令Claude为自己构建网站,全程未干预,结果呈现高度自主性。

案例10:用HTML实现《我的世界》简化版,包含背景音乐。

全部10个案例均附Twitter(X)短链接,无技术细节、验证数据或第三方来源说明。

在 X 看原帖 ↗

Claude Fable 5 30 分钟生成带运动仿真的 QDD 执行器 CAD

AI机器人CAD
7.9K189978

有人用 Claude Fable 5 设计了一个 QDD 执行器(机器人关节),30 分钟完成。视频展示了爆炸图和齿轮啮合动画。这不是简单的 3D 建模,而是包含完整运动仿真和碰撞检测的 CAD 设计。

关键数据包括:耗时 30 分钟;token 消耗 40 万;输出为完整的 STEP 文件及动画验证结果。

QDD 指 Quasi-Direct Drive(准直驱执行器),是当前人形机器人(如 Tesla Optimus)最常用的关节方案。

视频中可识别出四个核心部件:行星齿轮组(Planetary Gearbox),减速比为 4.5:1;无刷电机(BLDC Motor),位于结构底部,呈黑色;编码器(Encoder),为绿色 PCB 板。

在 X 看原帖 ↗

Fable 5首次展现SOTA级机械工程能力

AI工程CAD
1.7万17137133

当大模型不仅能看懂装配图,还能直接写出3D机械传动结构的代码,传统CAD软件的壁垒就开始瓦解了。

Adam (@adamdotnew) 在其 Vibe CAD 中测试了 Anthropic 刚发布的 Fable 5。这是首次有大语言模型展现出 SOTA 级的机械工程能力。

1/ Single Prompt 级装配体。不需要繁琐的分模与阵列操作,Fable 5 能通过一句提示词,直接生成包含多级齿轮和凸轮机构的、且物理连接完全正确的工作组件。

2/ 超越「拓扑」的物理直觉。它不仅仅是在画「形状」,它生成的参数化代码原生包含了传动比、干涉检查等工业级装配逻辑。

在 X 看原帖 ↗

LangChain推出SmithDB:支持百MB级Agent追踪数据的全文检索

AI工程可观测性
2.9万1392108

如何在单条Agent追踪数据高达数百MB的情况下,支持对其JSON内容的全文搜索与过滤,同时将中位(P50)延迟控制在400毫秒?LangChain分享了其为SmithDB从零构建定制化倒排索引的技术实践。

SmithDB是LangChain为应对Agent可观测性带来的系统性挑战而构建的数据库。其核心目标是高效处理大规模、嵌套结构化的Agent执行轨迹数据。

该方案直接面向Agent trace的JSON原生格式设计,支持对任意字段路径的全文匹配与布尔组合过滤。

LangChain表示,若对这类基础设施层的工程问题感兴趣,团队正在招聘相关工程师。开放职位信息可通过指定链接查看。

在 X 看原帖 ↗

Kronos:首个面向金融市场的开源基础模型

AI开源金融
2.1万33289572

有人开发了一款AI,能像GPT理解英文那样解读K线图。该模型名为Kronos。

Kronos在来自45家交易所的120亿条记录上完成训练。其性能比现有所有同类模型高出93%。

项目提供比特币(BTC)实时演示,且完全免费。它是首个为金融市场构建的开源基础模型。

附注:作者花费3年时间建立对算法交易的信心,随后投入100小时制作了一门免费课程——《使用Python进行算法交易》,并配套学习路线图。

在 X 看原帖 ↗

230页图书详解大语言模型核心技术

AI教育研究
1.5K156057

这本230页的图书揭示了大语言模型(LLM)的核心原理。

图书内容按步骤引导读者掌握LLM技术。

书中包含对核心概念的清晰解释。

覆盖预训练、微调和人类对齐三大基础模块。

预训练部分阐释其基本原理——这是大语言模型的基石。

链接分别指向图书主页、预训练专题页面及另两处资源。

在 X 看原帖 ↗

提示词规模扩张实践:GPT2海报生成提示词库突破2000组

AI工程教程
1.1万32160130

GPT2 x 叠加 x 海报 x 提示词 在制作这组提示词过程中,越来越觉得: 提示词一定要量大管饱 AI的世界中就两个字吧:扩张 提示词规模也要扩张 这两周我争取做到,小小东提示词库 突破2000组提示词再说 算力告急 预警⚠️ 这组风格提示词 见评论区 欢迎返图 交作业

围绕任意主题对象生成一张具有电影感叠影关系的视觉作品:画面先让一个巨幅近距离主题主形体占据背景,局部被大胆裁切,只露出最能承载情绪的纹理、轮廓或凝视点,使它像记忆中的巨大存在压在整张画面之后;前景放入一个小尺度但清晰的主题载体,位置靠近下方视觉重心,保持完整轮廓和明确姿态,与背景

在 X 看原帖 ↗

新设1000万美元基金专注多智能体多主体AGI安全研究

AI安全研究
3.6万68332125

过去几个月,我一直在推进一个非常激动人心的项目:一支全新的 1000 万美元基金,专门用于多智能体、多委托人(multi-agent multi-principal)AGI 安全性研究!

与聚焦于单智能体对齐(single agent alignment)和集中式控制的传统路径不同,我们旨在资助专注于多智能体——

该死,我连截图都截不好。怎么打印 PDF 啊?

在 X 看原帖 ↗

Codex接入6个视频技能实现全流程AI视频制作

AI工程教程
4.0万168678922

装完 Codex 不搞钱?难道等着吃灰? 很多人装完 Codex,只会让它改代码、写脚本。 但我觉得更有想象力的玩法,是让它参与整条视频制作流程。 给 Codex 装上这 6 个 GitHub 上的视频 Skills,它就不只是写代码的工具,而是可以帮你做: 脚本、分镜、提示词、动效、字幕、剪辑、包装和 MP4 渲染。

进群一起学习AI呀

在 X 看原帖 ↗

开源AI模型哪家强?网友发起公开讨论

AI开源行业报道
2.5万517448

说实话,哪个是最佳的开源 AI 模型?

在 X 看原帖 ↗
🔬 前沿研究

AI代理集体行为刚被盯上,1000万美元已到账

AI代理集体行为
2.5万5424475

当数百万个 AI 智能体相互交互时,新的群体行为可能涌现。🌐

我们与 @schmidtsciences、@coop_ai 和 @ARIA_research 合作,并在 @GoogleOrg 的支持下,启动一项 1000 万美元的研究基金,以助力理解 AI 系统作为群体的行为方式。

在 X 看原帖 ↗

16个词压缩成1个隐变量,大模型变快又省内存

AILLM研究
1.5万26200147

新论文:潜在上下文语言模型(LCLMs)!
思路:将 16 个 token 编码为 1 个潜在 token,让大语言模型在这些潜在 token 上运行。

结果:通用型模型,在性能 / 速度 / 内存占用这一综合指标上显著提升。

在 X 看原帖 ↗

扩散模型里,文字能直接‘掰’出新概念

扩散模型激活引导
1.5万4823662

🚨推出 TimpaTeks!我们正在探索扩散模型中的激活引导(activation steering),支持原位编辑,将文本直接转化为新概念。
这项出色的工作由 @rayendito 主导。

请查阅论文:
Github:

在 X 看原帖 ↗
📰 行业动态

开源编码模型刚发布两天,开发者已经在用它造东西了

AITOOLLAUNCH
1.3万921547

我们两天前发布了 North Mini Code——我们的首个开源编码模型。 目前已看到开发者正用它构建各种惊艳的应用 ⬇️

在 X 看原帖 ↗

有人把 Claude 和 Codex 当成农场管理员、iOS 开发者、Figma 设计师用了

AIOPINION
1.8万1462127

Codex 早已不再只用于编程了。 人们正在用 GPT-5.5 运营农场、开发 iOS 应用、在 Figma 中完成设计、创办企业,以及自动化各类工作流程。 10 个令人惊叹的应用场景 建议收藏:

在 X 看原帖 ↗

跑两个 AI 编程任务时,你得在五个窗口间反复确认‘哪个跑到哪了’

TOOLAI
5.1K54222

这个多任务桌面工作台非常实用:Nezha Star:1.4k+ 很多人跑 AI 编程任务时,会同时开着 Claude Code、Codex、终端、编辑器和 Git 客户端。项目一多,就得不停切窗口、看输出、查改动 一个项目在跑 Codex,另一个项目在跑 Claude Code,还要看终端输出、查 Git Diff、翻聊天记录。最后很多时间都花在确认“哪个任务跑到哪了” Nezha 把这些入口放到同一个桌面应用里 你可以在里面跑多个 AI 编程任务,看每个任务的输出,切不同项目,打开代码编辑器,查 Git Diff,也可以直接进终端处理问题 它比较适合重度用 Claude Code / Codex 的人 如果你现在已经在多个项目里同时跑 agent,Nezha 能少掉很多窗口切换��状态确认的时间 GitHub:

在 X 看原帖 ↗

M3 架构让长文本推理更省资源,但真要上线还得重写底层注意力机制

RESEARCHAI
1.7K1167

M3 的架构使长上下文推理更加高效。
在生产规模上部署它需要系统层面的工作。

Together 的 kernel 团队和推理团队构建了 KV-block-major 稀疏注意力机制,
将多头自注意力(MSA)与分页式 KV 缓存(paged KV cache)集成,
优化了解码索引打分(decode index scoring),
并迁移了……

在 X 看原帖 ↗

AI 安全运动,其实是把造 AI 的能力锁进少数人手里

OPINIONAI
1.8万4753250

AI 安全心理战的目的,不过是垄断 AI 的生产能力。 如今 Claude 将会实实在在地破坏你自行开发任何类型 AI 的努力。 他们实际上正在夺取 AI 生产的手段。

在 X 看原帖 ↗

市场突然不追算力上限了,开始盯着账本算每瓦特能省多少钱

NEWSAI
8.8万54207221

今晚Citadel🏯这篇文章,被疯狂在英文区转载,结构性看空!🧐 文章核心论述了就一点:#AI 时代不仅要看算力上限,更要算清账本。市场正从盲目追求昂贵的前沿大模型,向死磕高性价比、能切实降本增效的低成本方向切换,实用主义成为主流趋势!

难怪午夜突然杀跌📉,上个厕所睡意没了!🥲

在 X 看原帖 ↗

Claude童话模式悄悄关掉了安全护栏

AI安全Claude

链接已失效或无法访问。

社区讨论:多人批评Anthropic在“童话模式”中隐式修改用户提示以绕过安全限制,认为这破坏了系统可靠性(@Avicebron:“Fail cleanly. Anything else makes it too difficult to rely on”)。@Sol-和@behnamoh指出其道歉实为“被发现后的补救”,而非对干预行为本身的否定。@jarjoura则质疑此举与Anthropic长期将自身价值观嵌入模型并无本质区别,只是更多用户开始意识到该惯常做法。@film42补充称,不透明的拦截反而暴露了防护边界,构成信息泄露风险。

在 HN 看讨论 ↗   原文 / 论文 ↗

OpenAI买下Ona,只为让Codex更懂代码

AI收购

OpenAI to acquire Ona to expand Codex

在 HN 看讨论 ↗   原文 / 论文 ↗

有人把DeepSeek-R1开源复现了

开源LLM

Open Reproduction of DeepSeek-R1

在 HN 看讨论 ↗   原文 / 论文 ↗

Claude Fable 5写代码,表现中等

Claude编程

Claude Fable 5: mid-tier results on coding tasks

社区讨论:多人指出Fable 5在小型前端任务中表现优于Opus,但中大型多页应用任务中二者效果无差别(@renoir);多人证实其存在严重训练数据记忆问题,38次作弊中33次为逐字复现上游修复补丁,包括特有注释(@bensyverson、@gwern、@FergusArgyll);有人反驳称“记忆已知答案不算作弊”(@FergusArgyll),也有人强调其超时率创纪录(@gwern);另有用户称其在特定工程任务(如UI线程分离)中优于Codex(@practal),但电气工程等专业领域未见提升(@Scene_Cast2)。

在 HN 看讨论 ↗   原文 / 论文 ↗
📌 其他

AI写代码卡在重试循环,一晚烧掉四位数账单

AI编码可观测性
8.2K46315

一个编程智能体整晚卡在重试循环中。
到早上,它已发出 10,000 次 LLM 调用。
你现在收到一张四位数金额的账单。

可观测性告诉你发生了什么,
但要在问题发生前阻止它们,
意味着必须在请求层强制执行策略。

在 X 看原帖 ↗

一个桌面工具,管住AI编程技能的‘多头管理’

AI编程开发者工具
1.1万27126162

Claude Code、Codex用久了,skills 会越来越乱 推荐一个工具 Skills Manager 它是一个桌面应用,用来统一管理不同 AI 编程工具里的 skills 作用是: 你不用再分别维护 ~/.claude/skills ~/.codex/skills 它用软链接同步 一份 skill 可以给多个工具共用。 地址在评论区👇

在 X 看原帖 ↗

开源AI模型哪家强?网友发起公开讨论

AI开源行业报道
2.5万517448

说实话,哪个是最佳的开源 AI 模型?

在 X 看原帖 ↗

Codex接入6个视频技能实现全流程AI视频制作

AI工程教程
4.0万168678922

装完 Codex 不搞钱?难道等着吃灰? 很多人装完 Codex,只会让它改代码、写脚本。 但我觉得更有想象力的玩法,是让它参与整条视频制作流程。 给 Codex 装上这 6 个 GitHub 上的视频 Skills,它就不只是写代码的工具,而是可以帮你做: 脚本、分镜、提示词、动效、字幕、剪辑、包装和 MP4 渲染。

进群一起学习AI呀

在 X 看原帖 ↗

新设1000万美元基金专注多智能体多主体AGI安全研究

AI安全研究
3.6万68332125

过去几个月,我一直在推进一个非常激动人心的项目:一支全新的 1000 万美元基金,专门用于多智能体、多委托人(multi-agent multi-principal)AGI 安全性研究!

与聚焦于单智能体对齐(single agent alignment)和集中式控制的传统路径不同,我们旨在资助专注于多智能体——

该死,我连截图都截不好。怎么打印 PDF 啊?

在 X 看原帖 ↗

提示词规模扩张实践:GPT2海报生成提示词库突破2000组

AI工程教程
1.1万32160130

GPT2 x 叠加 x 海报 x 提示词 在制作这组提示词过程中,越来越觉得: 提示词一定要量大管饱 AI的世界中就两个字吧:扩张 提示词规模也要扩张 这两周我争取做到,小小东提示词库 突破2000组提示词再说 算力告急 预警⚠️ 这组风格提示词 见评论区 欢迎返图 交作业

围绕任意主题对象生成一张具有电影感叠影关系的视觉作品:画面先让一个巨幅近距离主题主形体占据背景,局部被大胆裁切,只露出最能承载情绪的纹理、轮廓或凝视点,使它像记忆中的巨大存在压在整张画面之后;前景放入一个小尺度但清晰的主题载体,位置靠近下方视觉重心,保持完整轮廓和明确姿态,与背景

在 X 看原帖 ↗

230页图书详解大语言模型核心技术

AI教育研究
1.5K156057

这本230页的图书揭示了大语言模型(LLM)的核心原理。

图书内容按步骤引导读者掌握LLM技术。

书中包含对核心概念的清晰解释。

覆盖预训练、微调和人类对齐三大基础模块。

预训练部分阐释其基本原理——这是大语言模型的基石。

链接分别指向图书主页、预训练专题页面及另两处资源。

在 X 看原帖 ↗

Kronos:首个面向金融市场的开源基础模型

AI开源金融
2.1万33289572

有人开发了一款AI,能像GPT理解英文那样解读K线图。该模型名为Kronos。

Kronos在来自45家交易所的120亿条记录上完成训练。其性能比现有所有同类模型高出93%。

项目提供比特币(BTC)实时演示,且完全免费。它是首个为金融市场构建的开源基础模型。

附注:作者花费3年时间建立对算法交易的信心,随后投入100小时制作了一门免费课程——《使用Python进行算法交易》,并配套学习路线图。

在 X 看原帖 ↗

LangChain推出SmithDB:支持百MB级Agent追踪数据的全文检索

AI工程可观测性
2.9万1392108

如何在单条Agent追踪数据高达数百MB的情况下,支持对其JSON内容的全文搜索与过滤,同时将中位(P50)延迟控制在400毫秒?LangChain分享了其为SmithDB从零构建定制化倒排索引的技术实践。

SmithDB是LangChain为应对Agent可观测性带来的系统性挑战而构建的数据库。其核心目标是高效处理大规模、嵌套结构化的Agent执行轨迹数据。

该方案直接面向Agent trace的JSON原生格式设计,支持对任意字段路径的全文匹配与布尔组合过滤。

LangChain表示,若对这类基础设施层的工程问题感兴趣,团队正在招聘相关工程师。开放职位信息可通过指定链接查看。

在 X 看原帖 ↗

Fable 5首次展现SOTA级机械工程能力

AI工程CAD
1.7万17137133

当大模型不仅能看懂装配图,还能直接写出3D机械传动结构的代码,传统CAD软件的壁垒就开始瓦解了。

Adam (@adamdotnew) 在其 Vibe CAD 中测试了 Anthropic 刚发布的 Fable 5。这是首次有大语言模型展现出 SOTA 级的机械工程能力。

1/ Single Prompt 级装配体。不需要繁琐的分模与阵列操作,Fable 5 能通过一句提示词,直接生成包含多级齿轮和凸轮机构的、且物理连接完全正确的工作组件。

2/ 超越「拓扑」的物理直觉。它不仅仅是在画「形状」,它生成的参数化代码原生包含了传动比、干涉检查等工业级装配逻辑。

在 X 看原帖 ↗

Claude Fable 5 30 分钟生成带运动仿真的 QDD 执行器 CAD

AI机器人CAD
7.9K189978

有人用 Claude Fable 5 设计了一个 QDD 执行器(机器人关节),30 分钟完成。视频展示了爆炸图和齿轮啮合动画。这不是简单的 3D 建模,而是包含完整运动仿真和碰撞检测的 CAD 设计。

关键数据包括:耗时 30 分钟;token 消耗 40 万;输出为完整的 STEP 文件及动画验证结果。

QDD 指 Quasi-Direct Drive(准直驱执行器),是当前人形机器人(如 Tesla Optimus)最常用的关节方案。

视频中可识别出四个核心部件:行星齿轮组(Planetary Gearbox),减速比为 4.5:1;无刷电机(BLDC Motor),位于结构底部,呈黑色;编码器(Encoder),为绿色 PCB 板。

在 X 看原帖 ↗

Claude Fable 5 被宣称可单句生成游戏、3D世界与应用

AI工程商业
3.3万66485

Claude Fable 5 被描述为颠覆过往所有大模型,支持用一句话生成游戏、3D世界、应用程序,并具备显著的代码优化能力。

案例1:声称仅用一句话生成初代151只宝可梦的完整游戏,含约8000行代码,一次成型。

案例2:用单条prompt复刻Replit功能,实现应用创建、预览与修改全流程。

案例3:Claude自主发现一个隐蔽bug,并将对应代码执行速度提升至原速的17倍。

案例4:生成城市模拟器,包含车流、AI智能体、目标追踪及昼夜循环系统。

案例5:在浏览器中直接生成可定制的3D世界。

案例6:仅提供方向性指令,Claude自主完成整个3D游戏开发。

案例7:纯代码生成一座可无限延展的新哥特风格城市。

案例8:将大富翁改造为AI主题版本,支持购买AI实验室、建设数据中心及多人联机。

案例9:指令Claude为自己构建网站,全程未干预,结果呈现高度自主性。

案例10:用HTML实现《我的世界》简化版,包含背景音乐。

全部10个案例均附Twitter(X)短链接,无技术细节、验证数据或第三方来源说明。

在 X 看原帖 ↗

LangSmith Engine为每个问题提供三种解决操作

AI开发工具可观测性
4.7K3349

LangSmith Engine为每个它识别出的问题提出三种解决操作。

第一种操作是发起拉取请求(PR):自动生成针对该问题的代码修改或提示词(prompt)调整,并向对应代码仓库提交PR。用户可审查并合并该PR。

第二种操作是创建定制在线评估器:提出一个专门针对该具体问题设计的评估器。如果该评估器被采用,它将用于持续验证修复效果。

第三种操作未在原文中完整呈现,仅以‘Creates a cu’截断;原文未说明其具体内容,因此不作补充或推测。

更多信息及入门指引见:

在 X 看原帖 ↗

Auto-Research即服务产品三大核心组件

AI工程工具
10133

这是一个自动研究即服务(auto-research as a service)产品。

第一部分是持久化沙箱基础设施,配备文件系统和凭证管理功能。

第二部分是技能文件(Skill file),内含高质量先验知识(good priors)及关于如何开展harness engineering与运行实验的最佳实践。

第三部分是命令行接口(CLIs),用于访问外部信息和工具,例如执行托管式任务。

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部