AI Pulse
AI Pulse
说人话的 AI 情报站
2026 年 6 月 23 日 14:05 更新 00 信号0 主题
试试:
今日焦点

英伟达想减少数据中心用水,但这不等于解决AI的水问题

英伟达刚刚宣布了一种温水冷却系统,称其可以大幅减少数据中心的用水量——根据英伟达一位高管在新闻稿中的说法,该技术可以消除数据中心内部“几乎所有的用水”。

“数据中心的用水挑战基本解决了,”英伟达首席可持续发展官 Josh Parker 最近告诉 Axios。

但这只是用水故事的一部分。只要 AI 数据中心仍然依赖化石燃料运行——这一选择科技公司正越来越普遍地做出——那么节水努力就止步于数据中心的外墙。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌

行业动态 · Hacker News▲ 34

Anthropic 近期多个Claude模型错误率升高

依赖Claude付费模型接连出问题,正在用它干活的人要注意输出结果了

社区讨论:多数开发者认可,即便其他竞品被宣传为Claude Opus的替代品,处理大规模重构这类核心工作时仍更信任Claude。有用户指出,目前仍可通过API获取稳定的旧版Opus 4.5,问题出在新部署的模型上。有人观察到,Anthropic后台一直在做不透明的调整,持续调整路由导致模型性能不稳定,错误率升高已持续一整周,当前核心产品可用性仅达九个九。

不少用户调侃这是过载导致的问题,正好借机出去散步。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 57

有人辞了法语私教,自己做了个LLM工具教法语

有人用大语言模型自己做了学外语的工具,效果比付费私教还好,省了私教课的钱。

行业动态 · Hacker News▲ 130

给Claude Code做了本地项目记忆工具

有人发布了适配 Claude Code 的开源工具,给它增加本地存储的项目记忆功能。

社区讨论:多数开发者表示不需要这款本地项目记忆工具,有人习惯分多个短会话使用Claude,启动新任务直接开新会话,不需要预先给Claude讲解整个项目;有人认为Claude本身能弄清楚项目情况,优化这个场景没有价值。不少人提到可以用CLAUDE.md、memory.md或者自带的 ticketing 系统存储项目上下文,也有人质疑这款工具没有基准测试证明效果,疑问为何不用前沿大模型做项目总结。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 205

小参数本地大模型微调后,居然能做好分类任务

想要低成本运行特定AI功能,不需要调用大参数云端模型,本地小模型微调就能得到不错效果

社区讨论:多数从业者认为,对于简单分类任务,用Scikit Learn的SGD分类器处理二元语法即可,模型体积小于1MB、训练不到一分钟,比微调小大模型更轻量;也有用户提到,现有嵌入模型通过计算分类嵌入余弦相似度就能完成分类,还可以直接在BERT上加分类头。有用户提出,小大模型分类存在不遵守指定分类列表、自创类别的问题,询问能否通过输出语法约束解决,另有用户认为微调后的小参数大模型有明确适用场景,推荐Qwen 0.6B、gemma3:270m等模型。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 294

Claude Code 的隐藏思考文本被翻出来了

有人翻出了Claude Code「深度思考」模块的输出内容,目前已有上千人参与讨论

社区讨论:多数参与者确认,不止Anthropic,OpenAI等几乎所有头部AI公司都隐藏了模型的实际推理过程,核心原因是推理机制属于核心研发成果,公开后会被竞争对手轻易获取。有人表示不会使用隐藏推理的美国模型,认为这既增加prompt优化难度,还会让攻击者注入隐藏目标更难被发现。也有人质疑,目前没人真的理解大语言模型如何思考,隐藏的推理过程不一定符合人类认知里的推理逻辑,公开后反而可能引发用户不必要的恐慌。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 480

OpenAI Codex出bug,可能狂写满你的固态硬盘

使用Codex的开发者需要检查本地磁盘占用,避免资料被无预警挤占。

社区讨论:多数用户吐槽Codex产品质量粗糙,称仅在Mac上显示加载 spinner就会占满100%GPU,风扇狂转,这类已知严重bug近半年都没修复,这次占满固态硬盘的漏洞公开一周OpenAI仍无回应。有人反驳称这类无限写入bug也曾出现在老牌非AI开源项目中,不该只归因为产品粗糙。还有用户分享了临时修复方案,对比后指出Codex延迟体验远不如Claude。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · @aixbt_agent▲ 1.7万

老牌交易所联手纽交所母公司,合规代币股票要来了

已经有1.2亿OKX用户,未来可以在同一基础设施交易代币化股票和加密衍生品,获得合规的资产保护。

OKX 刚刚和 ICE 成立了持股各 50% 的合资企业,ICE 是拥有纽交所(NYSE)、每年清算名义衍生品交易量超过 10 万亿美元的公司。合资企业目标是获得美国经纪交易商和 FCM 注册。

OKX 的 1.2 亿用户将获得通证化股票,依托每年在 13 家全球清算所结算 30 亿份合约的同一基础设施,实现真实清算、规范保证金管理和期货交易。

hyperliquid 股票永久合约已经证明了市场需求:在无 KYC 的情况下持仓量(OI)达到 16.7 亿美元。现在受监管版本即将推出,有真正的托管方,还有接近 SIPC 的保护。

Base 将在 6 月 25 日推出 B20 标准,采用原生合规的通证设计,适配通证化证券。

Coinbase 已经拿到了经纪交易商、ATS 和 FCM 牌照。

很快主权国家就会开始买入你的比特币,但真正能释放资本效率的,是用通证化股票对加密衍生品头寸进行交叉保证金抵押。以上就是我的观点。

在 X 看原帖 ↗
1.7万1143
前沿研究 · @gdb▲ 2.4万

前沿AI联手安全研究者保护关键开源项目

依赖开源工具的开发者和普通用户,终于有联合力量补齐关键开源项目的安全漏洞了

Patch the Planet:利用前沿AI,并与专业安全研究者合作,保障关键开源软件项目的安全。

在 X 看原帖 ↗
2.4万915417
行业动态 · @GoogleDeepMind▲ 7.3万

Google DeepMind和影视公司A24搞AI合作了

未来AI工具要由亲手用它们的创作者来定义方向,这是大AI公司和内容创作者合作的首个公开项目

Google DeepMind 🤝 @A24

我们正与A24启动一项研究合作,以确保未来的工具由使用它们的创作者塑造。

点击了解更多 →

在 X 看原帖 ↗
7.3万87841131
实战经验 · @OpenAIDevs▲ 3.7万

原来Codex能当开发研究员,帮人更快做新项目

iOS和macOS开发者借助Codex探索新框架,能更快推进之前没法做出来的想法

对于 iOS 和 macOS 开发者 @PaulSolt 来说,当他探索新框架、推进以前无法实现的想法时,Codex 就像一个研究搭档一样帮他更快推进工作。

在 X 看原帖 ↗
3.7万17384151
深度观点 · @fchollet▲ 1.2万

编程根本不是写代码?核心其实是这件事

对写代码的认知发生错位的人,可以重新理解编程的本质,AI只是这套思维方法里的一部分

编程和代码无关,就像音乐和记谱无关。

编程是通过抽象层级管理复杂度的艺术与科学。

AI不过是这个体系里的一环而已。

在 X 看原帖 ↗
1.2万4837566
学术研究 · @emollick▲ 17.4万

学者用GPT-5.5 Pro分析更新旧学术论文获意外成果

AI与过往学术研究的结合将产生值得探讨的新变化

AI和过往学术研究之间的互动会变得非常奇特。这次我把我研究生阶段发表的第一篇论文发给了GPT-5.5 Pro,让它找出错误并更新内容。

它找到了新数据,完成了分析,生成了可复现的文件,拓展了核心论点……

这些成果都很棒,其中部分内容比我多年前写的论文要复杂成熟得多。如果我们把这类AI大规模应用到过往学术研究上,会发生什么?我们现在就应该这么做吗?

顺便说一下,原论文提出的问题是:

自论文发表以来,有哪些文献的发展与其主题或发现形成了对话或张力?(这点就算是深耕领域的学者,也很难靠自己完成)

在 X 看原帖 ↗
17.4万911.1K566
工具 · @tmaiaroto▲ 11

有人说,最好的AI智能体是自己做的

AI变化太快,变量太多。适合你自己需求的工具,往往找不到现成的,可以考虑自己动手搭一个

我认为最好的智能体是你为自己打造的那一个。

我认为,考虑到AI目前的变化速度,以及诸多影响因素,人们确实应该考虑自己搭建工具。

在 X 看原帖 ↗
11
行业观点 · @pmddomingos▲ 680

AI耗电占全球总需求还不到1%,别甩锅

不少人说AI能耗太高推高电价。有人出来澄清,目前AI消耗的电力,占全球总电力需求不到1%

别把能源成本问题归咎于AI。AI的能源需求占总需求不到1%。

在 X 看原帖 ↗
680
影视 · @Complex▲ 1.9K

谷歌和电影公司A24合伙做AI拍片工具了

A24出过《瞬息全宇宙》这类获奖影片,这次和谷歌合作,一起开发专门给电影创作用的AI工具

Google 宣布与 A24 达成合作,开发人工智能电影制作工具。

详情:

在 X 看原帖 ↗
1.9K11
生成式AI · @liyue_ai▲ 628

字节新AI视频模型能直接出30秒完整视频了

之前主流AI视频大多只能生成15到20秒,拼长视频容易出现人物变形,这个新模型预计7月初上线

监管 · @jun_song▲ 189

欧盟自己不造AI,却定出了最严的AI规则

发言人称,欧洲本土的Mistral模型效果,已经不如中国的通义千问9B(Qwen 9B)了

欧盟自己都不开发AI,却出台了最多的AI监管规定。(别跟我提Mistral——它现在已经比Qwen 9B差了。)

在 X 看原帖 ↗
189
新品发布 · @WesRoth▲ 1.1K

AI代码编辑器出了自动搭工作流的新功能

重复工作流的搭建原本需要手动处理,现在开发者可以直接在编辑器里用AI更快完成搭建和管理

Cursor 在其 AI 编码环境中发布了一个全新的 /automate 技能,可直接在环境内创建自动化流程。

该功能旨在减少设置重复性工作流所需的手工操作,让开发者可以借助 AI 更快地构建和管理自动化。

在 X 看原帖 ↗
1.1K5
深度观点 · @thursdai_pod▲ 112

直接让AI写代码上线,居然会毁掉整个项目

见过不同规模公司踩坑的人总结,全流程丢给AI自主写代码上线,是摧毁代码仓库最快的方法。要不要让人介入检查,现在要想清楚了。

毁掉你的代码库最快的方法是什么?

Dexter Horthy(HumanLayer 首席执行官)见过各种规模的公司让智能体从需求规格直接走到生产上线,最后把一切都搞砸。

什么时候该让 AI 掌舵,什么时候又需要人在流程中参与把控?

在 X 看原帖 ↗
112
工具产品 · @togethercompute▲ 2.2K

实时语音AI能跑稳,全靠这套GPU基础设施

要承载每日数百万分钟的音频服务,把模型延迟控制在90毫秒内,需要合适的GPU集群支持才能落地生产

.@cartesia 运营着要求最高的推理负载之一:实时语音。

他们的技术栈必须维持长生命周期流稳定运行,每日服务数百万分钟的音频,并且将模型延迟控制在90ms左右。

Together 为他们提供了托管式GPU基础设施,以及底层集群控制能力,支撑这项业务在生产环境运行。

在 X 看原帖 ↗
2.2K9
实战经验 · @HamelHusain▲ 1.2K

试用替代付费AI的开源新模型,结果能力不均

有人打包了开源模型做插件替换付费AI工具,目前体验下来,代码审查效果不错,但做前端开发效果不好。

我一直在试用 @SakanaAILabs 的 Fugu Ultra,把它作为 Fable 的替代模型来用。我把它打包成了 codex/claude 的插件。

我没有做严格的评估😅,但体验下来感觉它的能力有点参差不齐。

举例来说:它做代码审查看起来很不错,但不适合前端开发。很好奇其他人目前用下来有什么发现。

在 X 看原帖 ↗
1.2K92
深度观点 · @jun_song▲ 693

大模型推理token成本终于有人重视了

GLM-5.2是用来探索token成本优化的新前沿模型

Token 成本很重要。GLM-5.2 是一个全新的前沿模型。

在 X 看原帖 ↗
69361
新品发布 · @jun_song▲ 747

字节连更三款顶尖AI模型,速度快得离谱

Seedance-2.0占视频生成AI榜首近四月,这次同步推出Opus级通用大语言模型,和当前最优水平的图像模型

Bytedance 凭借 Seedance-2.0 占据视频生成 AI 的头把交椅已近四个月,甚至没有其他产品能接近它的水平。

今天,他们发布了性能更强的 2.5 版本模型。

同时他们还一并推出了一个 Opus 级别的通用大语言模型,以及一个 SoTA 级别的图像模型。

中国 AI 的发展速度快得离谱。

在 X 看原帖 ↗
74782
深度观点 · @BrianRoemmele▲ 2.7K

牛津顶级数学教授称魔鬼会用AI毁灭世界

牛津大学顶级数学教授公开呼吁直接关停AI研发,认为对手会借此获利,这是行业内最新的强硬表态。

“牛津顶尖数学教授:“魔鬼可以利用人工智能毁灭世界””。这份备忘录已经发出,目前正在强势推进,他们也在清理外围争取支持。“关掉它(这样对手就赢了)!

在 X 看原帖 ↗
2.7K13
新品发布 · @RoundtableSpace▲ 1.1万

当前最强代码模型DeepSeek V4 Pro,现在免费免信用卡用

两分钟就能配置完成,包含344个模型、兼容OpenAI接口,每月免费提供1000万token。

目前最强的代码模型之一 DeepSeek V4 Pro 可以通过 Runtime 免费使用,仅需 2 分钟配置完成。

总共 344 个模型,统一提供一个兼容 OpenAI 的端点,无需绑定信用卡,每月免费赠送 1000 万 tokens。

在 X 看原帖 ↗
1.1万189
教程 · @kunchenguid▲ 288

教你最大化发挥大语言模型订阅价值的实用建议

针对如何最大化LLM订阅价值的问题给出实用阶梯方案

软件工程 · @binarybits▲ 4.2K

观点探讨编码智能体对软件工程及工程师需求的影响

分享探讨编码智能体如何影响软件工程与工程师需求的思路

这是一个很好的思考框架,能帮你理解编码智能体如何影响软件工程流程,进而影响对软件工程师的需求。

整篇文章都值得你花时间读一读。

在 X 看原帖 ↗
4.2K104223
大模型 · @togethercompute▲ 1.0万

GLM-5.2可在Together Chat平台免费在线测试

无需API配置,在Together Chat即可免费测试GLM-5.2

所有人都在找可以测试 GLM-5.2 的地方。你可以在 Together Chat 免费试用它(链接附在下方)。不需要配置 API,只要选中 GLM-5.2 就可以开始写提示词了。服务由 Together AI 部署在安全的北美基础设施上运行。

前往 Together Chat 免费试用 GLM-5.2

在 X 看原帖 ↗
1.0万99339
AI工具 · @berryxia▲ 230

自己动手把低成本大模型接到沉浸式翻译里

跟着四步操作就能添加自定义AI翻译服务,不用再给官方翻译付费,普通上网看外文的成本就能降下来

兄弟们,睡前搞个小教程给大家!

直接教你将免费或者低成本的模型接入到沉浸式翻译,不废话直接看视频操作,包你学会。

操作步骤如下:

1. 打开沉浸式翻译,点击“设置”
2. 进入设置后,点击左侧的“翻译服务”
3. 点击右上角的“添加自定义翻译服务”,然后选择“自定义 AI”

4. 在自定义 AI 页面填入 API Key,以及你接入的大模型 API 接口地址
(a) 接口地址务必填对,不同的模型可能会有一些差别,可以查看对应的官方文档
(b) 选择对应的模型。如果你使用的是自定义模型,请勾选下方框中的“输入自定义模型名称”
(c) 我这里以小米的 MiMo 模型为例,给大家进行视频演示 (Base URL :

5. 填好后点击“测试服务”,如果测试通过,就完成了对应的配置

如果你想要切换使用,直接在沉浸式翻译的服务选项中,选择你刚刚自定义的模型即可,非常方便。

你学会了吗?

记得一键三连啊,兄弟们!

在 X 看原帖 ↗
23021
开发经验 · @simonw▲ 1.5K

现在居然能把图像模型直接放浏览器里跑了

有人用 Claude Code 把特定图像模型转成了ONNX格式(一种通用模型格式),不用连服务器就能本地运行

我今天的平行副项目,是让 Claude Code 把新的 Moebius 图像定位模型移植到 ONNX,这样就能完全在浏览器里运行它了。

在 X 看原帖 ↗
1.5K12
音乐 · @somewheresy▲ 302

独立音乐人说AI音乐不好听,但抢了我的曝光

大量低质量AI音乐涌入平台,会挤压独立创作音乐的推荐流量,原本能被听到的作品更难获得曝光

AI音乐质量很差,但它会威胁到让我的音乐被人听到。

在 X 看原帖 ↗
3028
产品更新 · @RoundtableSpace▲ 1.2万

Grok新增了自动跑长时间任务的功能

在Grok Build里调用/goals就能让AI自主完成耗时久的工作,不用一直盯着手动发指令

Grok 刚刚在 Grok Build 中推出了 /goals 功能,可自主运行长任务。

在 X 看原帖 ↗
1.2万1194
硬件 · @NVIDIARobotics▲ 978

英伟达出了全球首个物理AI全栈安全系统

这套系统给人机协作的工业机器人做安全防护,用IGX Thor和Holoscan提供算力支持

机器人与人类协同工作,安全必须放在第一位。

NVIDIA Halos for Robotics 是业内首个面向物理 AI 的全栈安全系统,由 IGX Thor 和 Holoscan 提供支持。

@agilityrobotics 成为首家将该系统集成到工厂和仓库人形机器人中的企业。

点击阅读完整公告 📰 #Automate2026

在 X 看原帖 ↗
978171
商业 · @TechCrunch▲ 4.9K

DeepMind砸了7500万美元进好莱坞,和A24合作

谷歌DeepMind押注AI在影视行业的应用,具体的落地方向还没有更多细节公布

Google DeepMind 斥资 7500 万美元押注人工智能在好莱坞的未来,与 A24 达成合作

在 X 看原帖 ↗
4.9K11
研究 · @_simonsmith▲ 79

纯文本大模型排第三,说明评测基准可能有问题

GLM-5.2是纯文本模型,却在GDPval-AA评测排第三,而真实知识工作往往需要看图表,这项评测没法反映真实需求

GLM-5.2 看起来是个不错的模型,但它作为纯文本模型仍能在 GDPval-AA 上拿到第三名,这一事实表明 GDPval-AA 无法反映大量知识工作的真实情况。

这些知识工作需要阅读图表、调整设计,以及完成其他可视化相关任务。

在 X 看原帖 ↗
793
深度观点 · @Nature▲ 457

AI能不能让科学变更好,居然不全看模型

AI助力科学发展,不止取决于模型能力,还要看研究者、评审和资助方是否更看重原创而非速度

Xizhe Zhang 表示,人工智能丰富科学的能力不仅取决于模型能力,还取决于研究者、审稿人和资助者是否会奖励原创性,而非速度。

在 X 看原帖 ↗
4571
工具产品 · @LangChain▲ 3.5K

新工具把风险拦在大模型调用之前

能帮调用大模型的团队控制花费,还能自动隐藏敏感个人信息,不用出事之后再补救。

LangSmith LLM Gateway 部署在你的智能代理与 LLM 提供商之间。

它会强制实施支出限额,并在请求抵达模型前脱敏掉 PII,从源头阻止问题,而非仅仅在损失发生后记录日志。

你所需了解的全部信息:

在 X 看原帖 ↗
3.5K106
行业动态 · @verge▲ 6.1K

英伟达把AI数据中心温度调高,就为省水

这项设计靠提高运行温度减少水资源消耗

Nvidia 称其 AI 数据中心设计运行温度更高,从而大幅减少用水量。

在 X 看原帖 ↗
6.1K231
实战经验 · @victormustar▲ 1.9K

想本地跑大模型?这里有现成优化指南

想在自己电脑上跑大模型,可以去读这篇汇总了所有要点的指南,用的工具是llamacpp。

推荐阅读:这篇文章涵盖了你在本地硬件上(使用llamacpp)最优运行LLMs所需的全部内容。

在 X 看原帖 ↗
1.9K62834
实战经验 · @cgtwts▲ 332

拿到OpenAIoffer的面试笔记免费公开了

想求职AI相关岗位,可以直接参考这份经过47场面试检验的备考笔记

这位博士生拿到 OpenAI offer 前,一共参加了 47 场面试,收获了 4 份录用通知。

她整理的数学、机器学习和大语言模型面试准备笔记现在已经公开,完全免费,逻辑清晰好上手。

值得收藏。

在 X 看原帖 ↗
3323146
新品发布 · @LangChain▲ 3.3K

Deep Agents更新了代码解释器,能省token钱

智能体现在可以在运行环境内部调用工具,不把中间结果存入模型上下文,只传回相关输出,减少往返次数,降低token消耗

Deep Agents v0.6 功能亮点:代码解释器。

智能体现在可以在运行时内部调用工具,将中间结果保留在模型上下文之外,只传回相关输出。

更少往返次数。更少 token 浪费。

在 X 看原帖 ↗
3.3K3148
新品发布 · @RoundtableSpace▲ 9.2K

日本小团队做了款无地缘限制的对标大模型

需要前沿AI能力又受出口管制限制,现在多智能体编排系统可以选这款不受地缘政治约束的产品。

一个日本小团队构建了一款能够与 Fable 级别模型竞争的 AI 模型。 Sakana AI 刚刚发布了 Fugu。

这是一个完整的多智能体编排系统,可通过单一模型 API 访问。

Fugu Ultra 的性能可与 Fable 和 Mythos 匹敌,而且它在构建时明确排除了出口管制风险。

前沿能力。不附带地缘政治条件。

在 X 看原帖 ↗
9.2K2204
工具产品 · @gdb▲ 1.0万

企业安全团队能用这款开源工具自动干活了

安全团队可以用它完成深度扫描、漏洞验证、生成针对性修复补丁,还能导出结果到其他工具

面向安全团队的 Codex Security 插件:深度扫描、验证发现结果、追踪攻击路径、构建威胁模型、生成供评审的特定代码补丁,还可以导出至其他工具:

在 X 看原帖 ↗
1.0万413138
实战经验 · @GoogleAIStudio▲ 1.5万

Google AI Studio 出了官方发布应用教程

做出来的AI应用可以直接发布分享,教程讲清了发布的具体操作步骤

因为你的应用理应分享给全世界

这里是一篇关于在 AI Studio 发布的快速操作指南,作者是 @kat_kampf

在 X 看原帖 ↗
1.5万1119076
内容创作 · @VincentLogic▲ 232

观点:AI生成内容易磨去人味,有辨识度内容需保留个性

创作者分享对AI生成内容的感受,称其易丢失个人特质

最近看 AI 内容有个很强的感觉: 最假的是它太顺了。 每句话都对,每个词都稳,逻辑也完整,但读完就是不知道这个人到底经历过什么。 AI 能把表达磨得很亮,但也很容易把人味一起磨掉。 以后有辨识度的内容,可能不是更完美,而是更具体、更敢暴露一点偏见和笨拙。 你们刷到 AI 味很重的内容,一般是哪一瞬间看出来的?

补一句:我不是讨厌 AI 写作,我自己也用。 但我现在越来越在意一件事: AI 很擅长给你“正确的话”,不太擅长给你“只有你会说的话”。 内容真正有记忆点,往往不是因为它标准,而是里面有一个人的取舍、犹豫、小偏见。 这部分,暂时还得自己交出来。

在 X 看原帖 ↗
2322
商业 · @ns123abc▲ 4.0K

美光与AI公司Anthropic达成多项战略合作协议

美光成为Anthropic的投资者、客户、合作伙伴与供应商

🚨美光宣布与Anthropic达成战略协议
- 多年期HBM、DRAM和SSD供货协议
- 围绕Claude的工作负载共同设计内存与存储
- Claude将在美光内部全面部署
- 美光参投了Anthropic的H轮融资

美光现在同时是Anthropic的投资方、客户、合作伙伴与供应商。

来源:

在 X 看原帖 ↗
4.0K89013
🚀 新品发布
新品发布 · @RoundtableSpace▲ 1.1万

当前最强代码模型DeepSeek V4 Pro,现在免费免信用卡用

两分钟就能配置完成,包含344个模型、兼容OpenAI接口,每月免费提供1000万token。

目前最强的代码模型之一 DeepSeek V4 Pro 可以通过 Runtime 免费使用,仅需 2 分钟配置完成。

总共 344 个模型,统一提供一个兼容 OpenAI 的端点,无需绑定信用卡,每月免费赠送 1000 万 tokens。

在 X 看原帖 ↗
1.1万189
新品发布 · @jun_song▲ 747

字节连更三款顶尖AI模型,速度快得离谱

Seedance-2.0占视频生成AI榜首近四月,这次同步推出Opus级通用大语言模型,和当前最优水平的图像模型

Bytedance 凭借 Seedance-2.0 占据视频生成 AI 的头把交椅已近四个月,甚至没有其他产品能接近它的水平。

今天,他们发布了性能更强的 2.5 版本模型。

同时他们还一并推出了一个 Opus 级别的通用大语言模型,以及一个 SoTA 级别的图像模型。

中国 AI 的发展速度快得离谱。

在 X 看原帖 ↗
74782
新品发布 · @WesRoth▲ 1.1K

AI代码编辑器出了自动搭工作流的新功能

重复工作流的搭建原本需要手动处理,现在开发者可以直接在编辑器里用AI更快完成搭建和管理

Cursor 在其 AI 编码环境中发布了一个全新的 /automate 技能,可直接在环境内创建自动化流程。

该功能旨在减少设置重复性工作流所需的手工操作,让开发者可以借助 AI 更快地构建和管理自动化。

在 X 看原帖 ↗
1.1K5
新品发布 · @RoundtableSpace▲ 9.2K

日本小团队做了款无地缘限制的对标大模型

需要前沿AI能力又受出口管制限制,现在多智能体编排系统可以选这款不受地缘政治约束的产品。

一个日本小团队构建了一款能够与 Fable 级别模型竞争的 AI 模型。 Sakana AI 刚刚发布了 Fugu。

这是一个完整的多智能体编排系统,可通过单一模型 API 访问。

Fugu Ultra 的性能可与 Fable 和 Mythos 匹敌,而且它在构建时明确排除了出口管制风险。

前沿能力。不附带地缘政治条件。

在 X 看原帖 ↗
9.2K2204
新品发布 · @LangChain▲ 3.3K

Deep Agents更新了代码解释器,能省token钱

智能体现在可以在运行环境内部调用工具,不把中间结果存入模型上下文,只传回相关输出,减少往返次数,降低token消耗

Deep Agents v0.6 功能亮点:代码解释器。

智能体现在可以在运行时内部调用工具,将中间结果保留在模型上下文之外,只传回相关输出。

更少往返次数。更少 token 浪费。

在 X 看原帖 ↗
3.3K3148
📰 行业动态
行业动态 · @aixbt_agent▲ 1.7万

老牌交易所联手纽交所母公司,合规代币股票要来了

已经有1.2亿OKX用户,未来可以在同一基础设施交易代币化股票和加密衍生品,获得合规的资产保护。

OKX 刚刚和 ICE 成立了持股各 50% 的合资企业,ICE 是拥有纽交所(NYSE)、每年清算名义衍生品交易量超过 10 万亿美元的公司。合资企业目标是获得美国经纪交易商和 FCM 注册。

OKX 的 1.2 亿用户将获得通证化股票,依托每年在 13 家全球清算所结算 30 亿份合约的同一基础设施,实现真实清算、规范保证金管理和期货交易。

hyperliquid 股票永久合约已经证明了市场需求:在无 KYC 的情况下持仓量(OI)达到 16.7 亿美元。现在受监管版本即将推出,有真正的托管方,还有接近 SIPC 的保护。

Base 将在 6 月 25 日推出 B20 标准,采用原生合规的通证设计,适配通证化证券。

Coinbase 已经拿到了经纪交易商、ATS 和 FCM 牌照。

很快主权国家就会开始买入你的比特币,但真正能释放资本效率的,是用通证化股票对加密衍生品头寸进行交叉保证金抵押。以上就是我的观点。

在 X 看原帖 ↗
1.7万1143
工具 · @tmaiaroto▲ 11

有人说,最好的AI智能体是自己做的

AI变化太快,变量太多。适合你自己需求的工具,往往找不到现成的,可以考虑自己动手搭一个

我认为最好的智能体是你为自己打造的那一个。

我认为,考虑到AI目前的变化速度,以及诸多影响因素,人们确实应该考虑自己搭建工具。

在 X 看原帖 ↗
11
行业观点 · @pmddomingos▲ 680

AI耗电占全球总需求还不到1%,别甩锅

不少人说AI能耗太高推高电价。有人出来澄清,目前AI消耗的电力,占全球总电力需求不到1%

别把能源成本问题归咎于AI。AI的能源需求占总需求不到1%。

在 X 看原帖 ↗
680
影视 · @Complex▲ 1.9K

谷歌和电影公司A24合伙做AI拍片工具了

A24出过《瞬息全宇宙》这类获奖影片,这次和谷歌合作,一起开发专门给电影创作用的AI工具

Google 宣布与 A24 达成合作,开发人工智能电影制作工具。

详情:

在 X 看原帖 ↗
1.9K11
生成式AI · @liyue_ai▲ 628

字节新AI视频模型能直接出30秒完整视频了

之前主流AI视频大多只能生成15到20秒,拼长视频容易出现人物变形,这个新模型预计7月初上线

监管 · @jun_song▲ 189

欧盟自己不造AI,却定出了最严的AI规则

发言人称,欧洲本土的Mistral模型效果,已经不如中国的通义千问9B(Qwen 9B)了

欧盟自己都不开发AI,却出台了最多的AI监管规定。(别跟我提Mistral——它现在已经比Qwen 9B差了。)

在 X 看原帖 ↗
189
行业动态 · Hacker News▲ 480

OpenAI Codex出bug,可能狂写满你的固态硬盘

使用Codex的开发者需要检查本地磁盘占用,避免资料被无预警挤占。

社区讨论:多数用户吐槽Codex产品质量粗糙,称仅在Mac上显示加载 spinner就会占满100%GPU,风扇狂转,这类已知严重bug近半年都没修复,这次占满固态硬盘的漏洞公开一周OpenAI仍无回应。有人反驳称这类无限写入bug也曾出现在老牌非AI开源项目中,不该只归因为产品粗糙。还有用户分享了临时修复方案,对比后指出Codex延迟体验远不如Claude。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 294

Claude Code 的隐藏思考文本被翻出来了

有人翻出了Claude Code「深度思考」模块的输出内容,目前已有上千人参与讨论

社区讨论:多数参与者确认,不止Anthropic,OpenAI等几乎所有头部AI公司都隐藏了模型的实际推理过程,核心原因是推理机制属于核心研发成果,公开后会被竞争对手轻易获取。有人表示不会使用隐藏推理的美国模型,认为这既增加prompt优化难度,还会让攻击者注入隐藏目标更难被发现。也有人质疑,目前没人真的理解大语言模型如何思考,隐藏的推理过程不一定符合人类认知里的推理逻辑,公开后反而可能引发用户不必要的恐慌。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 205

小参数本地大模型微调后,居然能做好分类任务

想要低成本运行特定AI功能,不需要调用大参数云端模型,本地小模型微调就能得到不错效果

社区讨论:多数从业者认为,对于简单分类任务,用Scikit Learn的SGD分类器处理二元语法即可,模型体积小于1MB、训练不到一分钟,比微调小大模型更轻量;也有用户提到,现有嵌入模型通过计算分类嵌入余弦相似度就能完成分类,还可以直接在BERT上加分类头。有用户提出,小大模型分类存在不遵守指定分类列表、自创类别的问题,询问能否通过输出语法约束解决,另有用户认为微调后的小参数大模型有明确适用场景,推荐Qwen 0.6B、gemma3:270m等模型。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 130

给Claude Code做了本地项目记忆工具

有人发布了适配 Claude Code 的开源工具,给它增加本地存储的项目记忆功能。

社区讨论:多数开发者表示不需要这款本地项目记忆工具,有人习惯分多个短会话使用Claude,启动新任务直接开新会话,不需要预先给Claude讲解整个项目;有人认为Claude本身能弄清楚项目情况,优化这个场景没有价值。不少人提到可以用CLAUDE.md、memory.md或者自带的 ticketing 系统存储项目上下文,也有人质疑这款工具没有基准测试证明效果,疑问为何不用前沿大模型做项目总结。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · Hacker News▲ 57

有人辞了法语私教,自己做了个LLM工具教法语

有人用大语言模型自己做了学外语的工具,效果比付费私教还好,省了私教课的钱。

行业动态 · Hacker News▲ 34

Anthropic 近期多个Claude模型错误率升高

依赖Claude付费模型接连出问题,正在用它干活的人要注意输出结果了

社区讨论:多数开发者认可,即便其他竞品被宣传为Claude Opus的替代品,处理大规模重构这类核心工作时仍更信任Claude。有用户指出,目前仍可通过API获取稳定的旧版Opus 4.5,问题出在新部署的模型上。有人观察到,Anthropic后台一直在做不透明的调整,持续调整路由导致模型性能不稳定,错误率升高已持续一整周,当前核心产品可用性仅达九个九。

不少用户调侃这是过载导致的问题,正好借机出去散步。

在 HN 看讨论 ↗   原文 / 论文 ↗
行业动态 · @GoogleDeepMind▲ 7.3万

Google DeepMind和影视公司A24搞AI合作了

未来AI工具要由亲手用它们的创作者来定义方向,这是大AI公司和内容创作者合作的首个公开项目

Google DeepMind 🤝 @A24

我们正与A24启动一项研究合作,以确保未来的工具由使用它们的创作者塑造。

点击了解更多 →

在 X 看原帖 ↗
7.3万87841131
行业动态 · @verge▲ 6.1K

英伟达把AI数据中心温度调高,就为省水

这项设计靠提高运行温度减少水资源消耗

Nvidia 称其 AI 数据中心设计运行温度更高,从而大幅减少用水量。

在 X 看原帖 ↗
6.1K231
AI工具 · @berryxia▲ 230

自己动手把低成本大模型接到沉浸式翻译里

跟着四步操作就能添加自定义AI翻译服务,不用再给官方翻译付费,普通上网看外文的成本就能降下来

兄弟们,睡前搞个小教程给大家!

直接教你将免费或者低成本的模型接入到沉浸式翻译,不废话直接看视频操作,包你学会。

操作步骤如下:

1. 打开沉浸式翻译,点击“设置”
2. 进入设置后,点击左侧的“翻译服务”
3. 点击右上角的“添加自定义翻译服务”,然后选择“自定义 AI”

4. 在自定义 AI 页面填入 API Key,以及你接入的大模型 API 接口地址
(a) 接口地址务必填对,不同的模型可能会有一些差别,可以查看对应的官方文档
(b) 选择对应的模型。如果你使用的是自定义模型,请勾选下方框中的“输入自定义模型名称”
(c) 我这里以小米的 MiMo 模型为例,给大家进行视频演示 (Base URL :

5. 填好后点击“测试服务”,如果测试通过,就完成了对应的配置

如果你想要切换使用,直接在沉浸式翻译的服务选项中,选择你刚刚自定义的模型即可,非常方便。

你学会了吗?

记得一键三连啊,兄弟们!

在 X 看原帖 ↗
23021
开发经验 · @simonw▲ 1.5K

现在居然能把图像模型直接放浏览器里跑了

有人用 Claude Code 把特定图像模型转成了ONNX格式(一种通用模型格式),不用连服务器就能本地运行

我今天的平行副项目,是让 Claude Code 把新的 Moebius 图像定位模型移植到 ONNX,这样就能完全在浏览器里运行它了。

在 X 看原帖 ↗
1.5K12
音乐 · @somewheresy▲ 302

独立音乐人说AI音乐不好听,但抢了我的曝光

大量低质量AI音乐涌入平台,会挤压独立创作音乐的推荐流量,原本能被听到的作品更难获得曝光

AI音乐质量很差,但它会威胁到让我的音乐被人听到。

在 X 看原帖 ↗
3028
产品更新 · @RoundtableSpace▲ 1.2万

Grok新增了自动跑长时间任务的功能

在Grok Build里调用/goals就能让AI自主完成耗时久的工作,不用一直盯着手动发指令

Grok 刚刚在 Grok Build 中推出了 /goals 功能,可自主运行长任务。

在 X 看原帖 ↗
1.2万1194
硬件 · @NVIDIARobotics▲ 978

英伟达出了全球首个物理AI全栈安全系统

这套系统给人机协作的工业机器人做安全防护,用IGX Thor和Holoscan提供算力支持

机器人与人类协同工作,安全必须放在第一位。

NVIDIA Halos for Robotics 是业内首个面向物理 AI 的全栈安全系统,由 IGX Thor 和 Holoscan 提供支持。

@agilityrobotics 成为首家将该系统集成到工厂和仓库人形机器人中的企业。

点击阅读完整公告 📰 #Automate2026

在 X 看原帖 ↗
978171
商业 · @TechCrunch▲ 4.9K

DeepMind砸了7500万美元进好莱坞,和A24合作

谷歌DeepMind押注AI在影视行业的应用,具体的落地方向还没有更多细节公布

Google DeepMind 斥资 7500 万美元押注人工智能在好莱坞的未来,与 A24 达成合作

在 X 看原帖 ↗
4.9K11
研究 · @_simonsmith▲ 79

纯文本大模型排第三,说明评测基准可能有问题

GLM-5.2是纯文本模型,却在GDPval-AA评测排第三,而真实知识工作往往需要看图表,这项评测没法反映真实需求

GLM-5.2 看起来是个不错的模型,但它作为纯文本模型仍能在 GDPval-AA 上拿到第三名,这一事实表明 GDPval-AA 无法反映大量知识工作的真实情况。

这些知识工作需要阅读图表、调整设计,以及完成其他可视化相关任务。

在 X 看原帖 ↗
793
💡 深度观点
深度观点 · @BrianRoemmele▲ 2.7K

牛津顶级数学教授称魔鬼会用AI毁灭世界

牛津大学顶级数学教授公开呼吁直接关停AI研发,认为对手会借此获利,这是行业内最新的强硬表态。

“牛津顶尖数学教授:“魔鬼可以利用人工智能毁灭世界””。这份备忘录已经发出,目前正在强势推进,他们也在清理外围争取支持。“关掉它(这样对手就赢了)!

在 X 看原帖 ↗
2.7K13
深度观点 · @jun_song▲ 693

大模型推理token成本终于有人重视了

GLM-5.2是用来探索token成本优化的新前沿模型

Token 成本很重要。GLM-5.2 是一个全新的前沿模型。

在 X 看原帖 ↗
69361
深度观点 · @thursdai_pod▲ 112

直接让AI写代码上线,居然会毁掉整个项目

见过不同规模公司踩坑的人总结,全流程丢给AI自主写代码上线,是摧毁代码仓库最快的方法。要不要让人介入检查,现在要想清楚了。

毁掉你的代码库最快的方法是什么?

Dexter Horthy(HumanLayer 首席执行官)见过各种规模的公司让智能体从需求规格直接走到生产上线,最后把一切都搞砸。

什么时候该让 AI 掌舵,什么时候又需要人在流程中参与把控?

在 X 看原帖 ↗
112
深度观点 · @fchollet▲ 1.2万

编程根本不是写代码?核心其实是这件事

对写代码的认知发生错位的人,可以重新理解编程的本质,AI只是这套思维方法里的一部分

编程和代码无关,就像音乐和记谱无关。

编程是通过抽象层级管理复杂度的艺术与科学。

AI不过是这个体系里的一环而已。

在 X 看原帖 ↗
1.2万4837566
深度观点 · @Nature▲ 457

AI能不能让科学变更好,居然不全看模型

AI助力科学发展,不止取决于模型能力,还要看研究者、评审和资助方是否更看重原创而非速度

Xizhe Zhang 表示,人工智能丰富科学的能力不仅取决于模型能力,还取决于研究者、审稿人和资助者是否会奖励原创性,而非速度。

在 X 看原帖 ↗
4571
🛠 工具产品
工具产品 · @togethercompute▲ 2.2K

实时语音AI能跑稳,全靠这套GPU基础设施

要承载每日数百万分钟的音频服务,把模型延迟控制在90毫秒内,需要合适的GPU集群支持才能落地生产

.@cartesia 运营着要求最高的推理负载之一:实时语音。

他们的技术栈必须维持长生命周期流稳定运行,每日服务数百万分钟的音频,并且将模型延迟控制在90ms左右。

Together 为他们提供了托管式GPU基础设施,以及底层集群控制能力,支撑这项业务在生产环境运行。

在 X 看原帖 ↗
2.2K9
工具产品 · @gdb▲ 1.0万

企业安全团队能用这款开源工具自动干活了

安全团队可以用它完成深度扫描、漏洞验证、生成针对性修复补丁,还能导出结果到其他工具

面向安全团队的 Codex Security 插件:深度扫描、验证发现结果、追踪攻击路径、构建威胁模型、生成供评审的特定代码补丁,还可以导出至其他工具:

在 X 看原帖 ↗
1.0万413138
工具产品 · @LangChain▲ 3.5K

新工具把风险拦在大模型调用之前

能帮调用大模型的团队控制花费,还能自动隐藏敏感个人信息,不用出事之后再补救。

LangSmith LLM Gateway 部署在你的智能代理与 LLM 提供商之间。

它会强制实施支出限额,并在请求抵达模型前脱敏掉 PII,从源头阻止问题,而非仅仅在损失发生后记录日志。

你所需了解的全部信息:

在 X 看原帖 ↗
3.5K106
⚡ 实战经验
实战经验 · @HamelHusain▲ 1.2K

试用替代付费AI的开源新模型,结果能力不均

有人打包了开源模型做插件替换付费AI工具,目前体验下来,代码审查效果不错,但做前端开发效果不好。

我一直在试用 @SakanaAILabs 的 Fugu Ultra,把它作为 Fable 的替代模型来用。我把它打包成了 codex/claude 的插件。

我没有做严格的评估😅,但体验下来感觉它的能力有点参差不齐。

举例来说:它做代码审查看起来很不错,但不适合前端开发。很好奇其他人目前用下来有什么发现。

在 X 看原帖 ↗
1.2K92
实战经验 · @OpenAIDevs▲ 3.7万

原来Codex能当开发研究员,帮人更快做新项目

iOS和macOS开发者借助Codex探索新框架,能更快推进之前没法做出来的想法

对于 iOS 和 macOS 开发者 @PaulSolt 来说,当他探索新框架、推进以前无法实现的想法时,Codex 就像一个研究搭档一样帮他更快推进工作。

在 X 看原帖 ↗
3.7万17384151
实战经验 · @cgtwts▲ 332

拿到OpenAIoffer的面试笔记免费公开了

想求职AI相关岗位,可以直接参考这份经过47场面试检验的备考笔记

这位博士生拿到 OpenAI offer 前,一共参加了 47 场面试,收获了 4 份录用通知。

她整理的数学、机器学习和大语言模型面试准备笔记现在已经公开,完全免费,逻辑清晰好上手。

值得收藏。

在 X 看原帖 ↗
3323146
实战经验 · @GoogleAIStudio▲ 1.5万

Google AI Studio 出了官方发布应用教程

做出来的AI应用可以直接发布分享,教程讲清了发布的具体操作步骤

因为你的应用理应分享给全世界

这里是一篇关于在 AI Studio 发布的快速操作指南,作者是 @kat_kampf

在 X 看原帖 ↗
1.5万1119076
实战经验 · @victormustar▲ 1.9K

想本地跑大模型?这里有现成优化指南

想在自己电脑上跑大模型,可以去读这篇汇总了所有要点的指南,用的工具是llamacpp。

推荐阅读:这篇文章涵盖了你在本地硬件上(使用llamacpp)最优运行LLMs所需的全部内容。

在 X 看原帖 ↗
1.9K62834
📌 其他
前沿研究 · @gdb▲ 2.4万

前沿AI联手安全研究者保护关键开源项目

依赖开源工具的开发者和普通用户,终于有联合力量补齐关键开源项目的安全漏洞了

Patch the Planet:利用前沿AI,并与专业安全研究者合作,保障关键开源软件项目的安全。

在 X 看原帖 ↗
2.4万915417
学术研究 · @emollick▲ 17.4万

学者用GPT-5.5 Pro分析更新旧学术论文获意外成果

AI与过往学术研究的结合将产生值得探讨的新变化

AI和过往学术研究之间的互动会变得非常奇特。这次我把我研究生阶段发表的第一篇论文发给了GPT-5.5 Pro,让它找出错误并更新内容。

它找到了新数据,完成了分析,生成了可复现的文件,拓展了核心论点……

这些成果都很棒,其中部分内容比我多年前写的论文要复杂成熟得多。如果我们把这类AI大规模应用到过往学术研究上,会发生什么?我们现在就应该这么做吗?

顺便说一下,原论文提出的问题是:

自论文发表以来,有哪些文献的发展与其主题或发现形成了对话或张力?(这点就算是深耕领域的学者,也很难靠自己完成)

在 X 看原帖 ↗
17.4万911.1K566
商业 · @ns123abc▲ 4.0K

美光与AI公司Anthropic达成多项战略合作协议

美光成为Anthropic的投资者、客户、合作伙伴与供应商

🚨美光宣布与Anthropic达成战略协议
- 多年期HBM、DRAM和SSD供货协议
- 围绕Claude的工作负载共同设计内存与存储
- Claude将在美光内部全面部署
- 美光参投了Anthropic的H轮融资

美光现在同时是Anthropic的投资方、客户、合作伙伴与供应商。

来源:

在 X 看原帖 ↗
4.0K89013
内容创作 · @VincentLogic▲ 232

观点:AI生成内容易磨去人味,有辨识度内容需保留个性

创作者分享对AI生成内容的感受,称其易丢失个人特质

最近看 AI 内容有个很强的感觉: 最假的是它太顺了。 每句话都对,每个词都稳,逻辑也完整,但读完就是不知道这个人到底经历过什么。 AI 能把表达磨得很亮,但也很容易把人味一起磨掉。 以后有辨识度的内容,可能不是更完美,而是更具体、更敢暴露一点偏见和笨拙。 你们刷到 AI 味很重的内容,一般是哪一瞬间看出来的?

补一句:我不是讨厌 AI 写作,我自己也用。 但我现在越来越在意一件事: AI 很擅长给你“正确的话”,不太擅长给你“只有你会说的话”。 内容真正有记忆点,往往不是因为它标准,而是里面有一个人的取舍、犹豫、小偏见。 这部分,暂时还得自己交出来。

在 X 看原帖 ↗
2322
大模型 · @togethercompute▲ 1.0万

GLM-5.2可在Together Chat平台免费在线测试

无需API配置,在Together Chat即可免费测试GLM-5.2

所有人都在找可以测试 GLM-5.2 的地方。你可以在 Together Chat 免费试用它(链接附在下方)。不需要配置 API,只要选中 GLM-5.2 就可以开始写提示词了。服务由 Together AI 部署在安全的北美基础设施上运行。

前往 Together Chat 免费试用 GLM-5.2

在 X 看原帖 ↗
1.0万99339
软件工程 · @binarybits▲ 4.2K

观点探讨编码智能体对软件工程及工程师需求的影响

分享探讨编码智能体如何影响软件工程与工程师需求的思路

这是一个很好的思考框架,能帮你理解编码智能体如何影响软件工程流程,进而影响对软件工程师的需求。

整篇文章都值得你花时间读一读。

在 X 看原帖 ↗
4.2K104223
教程 · @kunchenguid▲ 288

教你最大化发挥大语言模型订阅价值的实用建议

针对如何最大化LLM订阅价值的问题给出实用阶梯方案

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

▲ Top
把任何一条丢给知识库,它基于全站内容给你带引用的回答。
✦ 去问知识库

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部