AI Pulse
AI Pulse
说人话的 AI 情报站
2026 年 6 月 22 日 14:04 更新 00 信号0 主题
试试:
今日焦点

三星电子全球员工可用ChatGPT和Codex,从写代码到写营销文案

三星电子向韩国所有员工及全球DX部门员工提供ChatGPT Enterprise和Codex。这是OpenAI迄今为止最大的企业部署之一。

三星计划在研发、制造、营销、企业职能等所有业务领域使用这两款工具。员工可以用ChatGPT处理报告、营销文案,用Codex把想法变成可运行的软件、内部工具、网站和自动化工作流。普通员工也能在核心业务流程中直接受益,不再只是技术人员的专属。

Codex:非技术人员的编程助手

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌

开发工具 · @RoundtableSpace▲ 2.2万

Claude代码子代理,现在能嵌套五层跑完整链路了

每一层都有独立的上下文窗口,只有顶层的结果会返回给主程序,五层是目前的硬性上限。

Claude Code 子代理现在最多支持嵌套 5 层深度,已经有人完整跑通了整条链。

每一层都在自己的上下文窗口中运行。

只有顶层的摘要会返回给主代理,5层深度是硬性上限。

在 X 看原帖 ↗
2.2万2399
大模型 · @stevibe▲ 1.3K

有人在问字节跳动的Seed-2.1-Pro什么时候能开放测试

开发者已经留意到这款大模型更新,目前还没拿到公开测试的资格。

有意思,ByteDance 的 Seed-2.1-Pro,我们什么时候能测试?

在 X 看原帖 ↗
1.3K71
新品发布 · @togethercompute▲ 2.9K

下一代AI推理要用专门定制的基础设施了

Together AI和5C正在部署NVIDIA GB300 NVL72系统,专为大规模AI推理和推理任务配置。

下一代推理需要专为特定用途打造的基础设施。

Together AI 和 5C 正在部署 NVIDIA GB300 NVL72 系统,该系统配备高密度计算、先进散热方案,以及面向 AI 优化的存储,适用于大规模推理和思考。

在 X 看原帖 ↗
2.9K4309
实战经验 · @vincent_koc▲ 743

混合开源闭源模型,已经干翻纯大模型了

有人在优化智能代理的工作中发现,混合不同模型的集成方法效果优于其他所有方案,2026年可能会出现更多这类推理路由模型。

看到通过开放+闭源模型融合构建的神话级模型在编排中正常工作,太震撼了。

我在2025年末研究智能体优化时就见过这种场景,当时LLM集成方案的表现碾压了其他所有方案。

我认为我们会在2026年看到更多推理路由模型。

在 X 看原帖 ↗
743111
大语言模型 · @tekbog▲ 547

网友推测Meta若发布新大模型将是协作型LLM

社交平台用户推测Meta下一款大语言模型为协作办公LLM

如果 Meta 再发布一款新模型,你懂的,它肯定是一款面向职场协作的 LLM。

在 X 看原帖 ↗
547201
创业 · @contextconor▲ 466

创业公司Hyperspell成立 为每家企业打造企业大脑

业内人士预测2030年所有企业都将配备企业大脑

到2030年,公司没有「公司大脑」会变得和现在没有生产数据库一样荒谬。每家公司都会为智能体维护单一可信数据源,事后看来这会是一件理所当然的事。

我们相信,每家公司都理应拥有自己的大脑,不需要投入庞大的工程师团队从零搭建。这就是我们创立@hyperspell的原因:为每家公司打造大脑。

在 X 看原帖 ↗
4662181
产品发布 · @hardmaru▲ 5.5万

Sakana AI发布Fugu,推进AI集体协作生态发展

Sakana AI发布Fugu,认为协同编排是AI下一前沿,保障AI主权

阅读全文 →
5.5万60417102
前沿研究 · @RoundtableSpace▲ 7.7K

新AI自我进化后,赢了顶尖大模型视觉推理

不同大模型之间的性能差距再次拉大,目前领先模型的优势已经非常明显

基于Hyperagent的Fable 5会为了达成开放式目标持续自我改进数小时,并在视觉推理任务中持续击败Opus 4.8。

模型之间的差距再次变得非常巨大。

在 X 看原帖 ↗
7.7K245
深度观点 · @hwchase17▲ 3.6K

这个AI工具居然支持所有通用模型?

它确认该工具不绑定特定模型,是通用工具。

是的,它是模型无关的,而且是通用型的。

在 X 看原帖 ↗
3.6K162
行业动态 · @RoundtableSpace▲ 1.1万

一次AI生成就做出三万五千美元级网站

原本需要设计师、动效师和前端开发者协作数周的工作,现在AI一次会话就能完成,成本和时间都大幅降低。

一次AI会话生成出了价值35,000美元级别的网站。

一个看上去就是高级代理商做的落地页,通过Claude Code和Higgsfield从头到尾完整生成了。整个站点的体验是电影级产品体验,而非静态网页。

这套系统产出了什么:
→ 自动生成了完全由滚动驱动的动画布局
→ 从多个生成式视频模型提取动态片段
→ 无需手动设置,自动添加了颗粒、粒子、暗角、玻璃卡片和调色等效果
→ 不需要编写关键帧动画,就生成了滚动行为和节奏

常规情况下制作它需要什么:
→ 设计师、动态艺术家和前端开发协作完成
→ 数周的协调和迭代工作
→ 需要手动对接多个工具来处理滚动、动画和素材

成本差异才是关键转变:
→ 传统代理商建站价格在6,000到35,000美元之间
→ 普通制作项目的成本通常都在5,000美元以上
→ AI生成版本只需要订阅费加少量积分消耗
→ 交付时间从数周缩短到一次会话完成。

在 X 看原帖 ↗
1.1万144
AI安全 · @willccbb▲ 2.9K

AI安全核心问题:稳健模型行为评估的形式化自动化

研究者提出AI安全关键问题,团队正推进相关研发

人工智能安全领域最重要的问题,同时也是能让RSI彻底爆发的最大解锁项,就是将鲁棒模型行为评估的科学体系形式化并自动化。

优化器和架构都是很棒的吸引人消遣,RSI肯定也能找出一些漂亮的调整,但真正的大杠杆是评估、数据和内核。而数据和内核本质上都是评估问题,所以说到底其实就只有评估。加上把该死的GPU部署上线。

在@primeintellect,我们正努力为大众规模化扩展评估能力和GPU资源,来加入我们吧。

在 X 看原帖 ↗
2.9K1484
开源 · @jerryjliu0▲ 28.3万

开发者推出全球最快更精准的开源PDF转Markdown解析器

开发者发布开源PDF转Markdown解析器LiteParse v2.1,速度精度领先

我们打造了世界上最快的 PDF 转 markdown 解析器 🚀⚡️ 而且在三项标准化基准测试(olmOCR0-bench、opendataloader-bench、ParseBench)中,它的准确率比所有其他开源无模型解析器(pymupdf4llm、opendataloader、pdf-inspector、markitdown)都更高。

现在为你介绍 LiteParse v2.1。v2 基础版已经是全球最快的文档转文本解析器,而在本次新版本中我们加入了 markdown 支持。

它完全开源(Apache 2.0 协议)且免费,可通过 CLI/Rust/Node/Python/WASM 使用,还能作为一键式代理技能安装。

快来体验 LiteParse:

以下是我们的准确率基准测试结果

以下是我们的速度测试结果

在 X 看原帖 ↗
28.3万2011.6K2.3K
大模型 · @LottoLabs▲ 270

通义千问27B参数模型,据说顶得上95%人类总智能

这是一位创作者在社交平台给出的个人判断。参数规模270亿的开源大模型,性能已经被不少从业者看好。

我很确定 qwen 27b 相当于 >95% 当前人类智力总和。

在 X 看原帖 ↗
2704
工具 · @JinjingLiang▲ 111

第一次拍视频,直接丢给AI剪就完事了

创作者拍完素材后,把所有剪辑工作交给AI完成,明天会放出最终成品。

今天拍了我的第一条视频。现在我把它交给AI来剪辑🤞

明天会发布成品。

在 X 看原帖 ↗
1118
行业观点 · @jun_song▲ 35

从业者觉得,去中心化AI推理才是未来方向

去中心化推理指把AI计算任务分散到多个独立节点完成,而非集中在少数大型数据中心。

我们都知道去中心化AI推理是未来。

在 X 看原帖 ↗
351
研究 · @odysseus0z▲ 53

研究者训练了强化学习模型来解决管理失当问题

强化学习(RLM)是一种让AI通过试错反馈优化决策的训练方法。

训练了 RLM 来解决天才管理失当问题

在 X 看原帖 ↗
531
行业动态 · @Techmeme▲ 913

投行建议数据中心开发商换杠杆贷款发债

投行预计今年这类杠杆贷款会发行约150亿美元,数据中心赛道的融资玩法开始变了。

来源:Morgan Stanley 正游说数据中心开发商使用杠杆贷款而非债券,并估计今年这类贷款的发行规模将达到约 150 亿美元(出自 The Information)

(前往 Techmeme dot com 获取链接和完整上下文!)

在 X 看原帖 ↗
9131
实战经验 · @LottoLabs▲ 326

玩本地大模型,别信SOTA模型说的搜索结果

刚入坑本地大模型的人容易踩坑,现有SOTA模型的网页搜索结果不靠谱,得专门调整提示词才能拿到合格结果。

提醒一下,如果你刚开始接触本地模型,你完全不能相信来自SOTA模型的任何输出。

网络搜索已经毁掉它了。你必须专门写提示才能得到像样的结果。

很多人都会被带偏😂

在 X 看原帖 ↗
32671
实战经验 · @jun_song▲ 316

跑本地AI选这些量化格式就对了

根据自己的硬件选推荐的量化格式,就能最大化本地AI的运行速度和性能

针对本地AI格式推荐的量化规格:

- MLX(Mac):6bit+
- NVFP4(Nvidia):4bit
- GGUF(Llama.cpp):4bit+
- DQ(通用):混合 3bit+

请使用适配你硬件的最优优化格式,以最大化速度和性能。

在 X 看原帖 ↗
3166
深度观点 · @jessegenet▲ 802

一刀切禁止学生用AI 反而拖垮国家发展?

想要处理AI和教育的关系需要更精细的方案,一刀切禁令不是精细选择,为防止学术下滑禁止年轻人接触AI,可能反而造成国家发展下滑。

我们需要一种精细平衡的方法来处理 AI 与教育的关系,但禁令绝非精细平衡。

如果你禁止最年轻的公民接触他们这代人标志性的技术,你原本想要阻止学术滑坡,结果却很容易因此造成国家衰退。

在 X 看原帖 ↗
80251
深度观点 · @tekbog▲ 279

Anthropic自己先被监管了,转头喊AI危险

已经处于监管环境下的企业,反过来呼吁全行业加强AI监管。这件事本身值得观察

anthropic 一边告诉所有人AI有多危险、多么需要监管,一边早就已经享受监管红利了。

在 X 看原帖 ↗
2795
效率 · @Formulasearch▲ 55

关于使用AI多任务处理效率的个人使用感悟

作者分享使用AI多任务的体验,提出专注单任务更高效

我一直觉得ai可以让我同时做多件事情, 但实际上我脑子线程是十分有限的, ai确实是干活快,但很多事一起进行时,我要不停的切换我的思维去审核ai产出的每一条结果,这反而会严重分散我的注意力,根本没有提高效率。 所以不如专注高效的去做好一件事,再开始下一个。

在 X 看原帖 ↗
551
多智能体 · @altryne▲ 884

AI初创Sakana发布多智能体编排新技术超预期

Sakana发布类单模型运行的多智能体编排产品,评测表现出色

Sakana 在本周初发布了 AI 公告!多智能体编排可以表现得像单个模型一样,而且……性能超过了 Fable!?

对于一个非前沿实验室来说,这些评测结果有点疯狂(现在它算前沿了?)

在 X 看原帖 ↗
884141
大模型 · @juddrosenblatt▲ 2.7万

GLM-5.2在编码测试中性能超过GPT-5.5

有观点提到,头部AI实验室没办法停下来放缓研发速度,为了保住商业模式只能持续训练更大的模型

它们谁都承担不起暂停或放缓发展的代价。只需看看GLM-5.2的能力就能证明这一点。

为了保护自身商业模式,前沿实验室必须不断训练能力越来越强的系统,才能在开源面前、在彼此竞争中保持领先。

冰面之下,水流仍在汹涌奔涌,我们也在继续朝着终点冲刺。

GLM 5.2在编码基准测试中表现超过GPT-5.5。

公布的基准测试结果显示,在聚焦编码的测评中,GLM 5.2的性能提升明显高于GPT-5.5。核心结果包括:SWE-bench Pro得分为62.1,GPT-5.5为58.6;Terminal-Bench 2.1得分为81.0;FrontierSWE得分为74.4%,这让它跻身顶级编码模型行列。

在 X 看原帖 ↗
2.7万3546
职场 · @FurkanGozukara▲ 302

Anthropic CEO承认在用AI替换人类软件工程师

他确认现在AI几乎写完了所有代码,人类工程师只需要做收尾工作

🚨 我去?!Anthropic CEO Dario Amodei随口承认,他自己的公司正在用AI取代人类软件工程师。

他确认,现在几乎所有代码都由AI编写,让人类员工彻底被淘汰。科技精英们是在故意摧毁工人阶级!

在 X 看原帖 ↗
3021
工具 · @Michaelzsguo▲ 26

普通人只花四步就能本地克隆自己的声音了

录30条带提示的语音样本,用LoRA(低秩适配微调技术)微调模型,合并声纹检查点,最后本地部署运行

我训练了一个本地 TTS 模型,克隆了自己的声音。整个流程简单得出人意料:
→录制 30 条带提示的语音样本 → 用 LoRA 微调 MOSS-TTS → 合并语音检查点 → 在本地以兼容 OpenAI 的 TTS API 形式部署 → 在任何需要配音的地方使用我的声音。

真正的测试是给我妻子发了一段配音。

她的回复是:「这完完全全就是你的声音。」

Model:按照这些简单步骤就能克隆你的声音。你需要给智能体提供你自己的声音。

请在下方分享你的体验,或者任何问题/意见。

在 X 看原帖 ↗
262
行业观点 · @tekbog▲ 80

AI现在不只是技术竞赛,还是文化意识形态战争

每个国家都想让自己的AI占据主导,输出自身意识形态。美国现在封闭模型领先,但没人用的话优势也不大

现在每个国家都想让本国的AI占据主导地位,融入自身的意识形态。

美国在闭源模型领域处于领先,但如果没人用这些模型,领先也起不了多大作用。

AI如今也是一场文化战争。

在 X 看原帖 ↗
802
开源 · @bookwormengr▲ 144

有人怼了闭源 labs 指责开源偷代码的说法

闭源实验室称开源项目能做起来全靠偷自家内部代码和文档,有网友吐槽这是新的找借口套路

科技行业动态 · @GoogleCloudTech

Google用多AI系统迁移自身生产级机器学习模型

把机器学习模型从一个框架转到另一个框架,不只是改改语法那么简单

将生产级机器学习模型从一个框架迁移到另一个框架,并不是简单更新语法就能完成的事。

请阅读下文,了解我们如何部署专用多智能体AI系统,将Google部分规模最大的生产模型从TF迁移到JAX ↓

在 X 看原帖 ↗
实战经验 · @Ex0byt▲ 186

GLM-5.2能给DGX Spark生成专属CUDA核了

生成的核可以无量化无剪枝全速运行DeepSeek-v4,直接优化GLM-5.2的本地部署服务

从我第一次告诉大家GLM-5.2的能力(而且你们听进去了)至今,已经过去5天了。

现在GLM-5.2正在为DGX Spark生成自定义CUDA内核,让它能够全速运行DeepSeek-v4,无需量化或剪枝。

这直接转化为了GLM-5.2的优化本地化部署服务。

在 X 看原帖 ↗
18615
深度观点 · @GaryMarcus▲ 430

大模型真的完全不能产生新想法吗?有人不同意

有人觉得现有关于大模型创造力的说法太绝对。虽然大模型确实很少产生真正全新的想法,但目前没有数学能证明它完全做不到。

依我之见,这种关于创造力的说法太过绝对了。

LLM 确实很少能产生真正新颖的想法,但我认为没有任何数学证明它们不可能产生新想法。

需要注意的是,目标函数和输出并不是一回事。

在 X 看原帖 ↗
43021
行业动态 · @Rainmaker1973▲ 154

索尼AI乒乓球机器人,打赢了职业乒乓球选手

专门开发的AI机器人,已经能在国际乒联官方规则下战胜职业运动员,普通人可以看看AI在体育领域的推进速度

Sony AI 的乒乓球机器人 Ace 在 ITTF 官方规则下击败了职业球员木原美悠。

在 X 看原帖 ↗
15415
工具产品 · @TheTuringPost▲ 390

整理了10款用于智能体强化学习的开源工具

需要搭建智能体强化学习技术栈,可以从这份现成的工具清单入手找适配工具

适用于智能体强化学习(Agent RL)技术栈的 10 款开源工具 ↓
- OpenPipe ART
- verl-agent
- Agent Lightning
- Unsloth
- OpenRLHF
- SkyRL
- NVIDIA’s Polar
- Agent-R1
- RAGEN
- Marti

收藏这份清单,点击这里获取链接、用例,以及各工具在 Agent RL 技术栈中的定位 →

在 X 看原帖 ↗
39077
实战经验 · @hwchase17▲ 1.1K

跟着教程自己搭一个Claude Code平替

社区出了教程,教你用Deep Agents搭建类似Claude Code的智能代理,GLM-5.2效果不错,刚好可以试试

「用 Deep Agents 打造你自己的 Claude Code」

这是社区作者写的一篇好文章,展示了如何用 Deep Agents 构建一个类似 Claude Code 的智能体。

考虑到 GLM-5.2 目前表现相当强劲,这篇文章尤其具有参考意义。

在 X 看原帖 ↗
1.1K21213
实战经验 · @Voxyz_ai▲ 169

半年换七款 coding AI,开源款才最实在

从二月到六月,连续更新换代的多款闭源 coding AI里,只有开源权重的GLM最终留了下来

自二月以来我主力使用的编码模型:

Opus 4.6:2月5日
GPT-5.4:3月5日
Opus 4.7:4月16日
GPT-5.5:4月23日
Opus 4.8:5月28日
Fable 5:6月9日(6月12日停服)🪦
GLM-5.2(开放权重):6月16日

说实话,这个开源开放权重的模型意义重大。

在 X 看原帖 ↗
16961
行业动态 · @Discoplomacy▲ 485

英国情报机构最担心的AI风险居然是这个

英国情报机构GCHQ和AI安全机构AISI合作,目前最让GCHQ睡不着觉的AI安全问题,是间接提示注入攻击

GCHQ 与 AISI 展开合作这件事很有意思,GCHQ 在 AI 领域最夜不能寐的问题也同样有意思:那就是间接提示注入。

在 X 看原帖 ↗
48526
深度观点 · @code_star▲ 185

做好数据清洗居然靠这么基础的常识

做数据清洗和生成合成数据时,记住「模型自回归训练」这个基础知识点很重要,很多人会忽略这点。

你一定会惊讶,仅仅记住“模型是自回归训练的”这样简单的一句话,对做好数据清理和合成数据工作来说,居然这么重要。

在 X 看原帖 ↗
18571
实战经验 · @DeryaTR_▲ 856

一次生成教父电影网站,国产大模型性能很能打

有人用智谱AI的GLM-5.2一次生成完整站点,它回答生物医学问题的水平接近部分高阶GPT模型,大小控制得很不错。

我用 @Zai_org 的 GLM-5.2 一次性就做出了这个关于《教父》系列电影的网站!

它对生物医学问题的输出质量也非常出色,虽然还没到 GPT-5.5 的水平,但部分回答已经接近 5.2–5.4 层级。

考虑到这个模型的尺寸,能做到这样已经非常了不起了!

在 X 看原帖 ↗
8561102
行业动态 · @Nature▲ 181

AI开始让职场人技能退化,先碰到了这些领域

有证据显示,AI驱动的技能退化已经在医学、计算机科学等领域发生。从业者能提前观察到自身技能的变化。

有证据表明,由AI驱动的「去技能化」已经开始出现在医学、计算机科学和其他领域。

在 X 看原帖 ↗
18111
实战经验 · @TheAhmadOsman▲ 310

不同推理引擎跑大模型,速度差了好几倍

相同硬件换对推理软件,大模型输出token速度能翻数倍,多卡CUDA选对软件提速更明显。

为什么我要聚焦于适配你硬件的推理引擎/软件栈?

两块RTX 3090:原本约14.5 tok/s,迁移到TP=2的vLLM后可达约64 tok/s。

RTX PRO 6000:原本约32 tok/s,迁移到Sglang后可达约110 tok/s。

因此结论是:

CUDA/2块及以上GPU:ExLlamaV3/vLLM/Sglang > llama.cpp

边缘设备:llama.cpp > Ollama

在 X 看原帖 ↗
310107
深度观点 · @haider1▲ 631

谷歌内部对大模型未来分裂,至今仍未聚焦

内部分歧导致同时推进太多方向,人才正在持续流出,战略方向不统一会拖慢AI产品落地进度

我认为 google 现在处境很艰难。问题在于,google 内部有一些团队认为 LLMs 是未来,另一些团队却不这么想,所以他们同时在推进太多项目。

openai 也遇到过同样的问题,但当它开始落后于 anthropic 时,它砍掉了其他项目,重新聚焦核心。

google 还没有完成重新聚焦——这让 openai 和 anthropic 看起来方向更一致,这可能也是知名人士接连离开的原因。

在 X 看原帖 ↗
6314231
教育, 数学, 统计 · @xlr8harder▲ 183

博主呼吁高中数学教学优先设置统计学内容

博主称多数人终生用不到积分,统计对决策更重要

我认为如果我们在高中数学教学中将统计学列为优先内容,世界会变得更好。

大多数人终其一生都不需要计算积分,而基础统计学却直接关系到许多重要的人生决策。

在 X 看原帖 ↗
18315
计算机视觉 · @kalomaze▲ 1.4K

研究者验证无层级结构噪声残差下残差预测仍有效

20M参数Transformer验证,无层级结构噪声残差仍可实现预测

你们知道吗?next-residual-prediction 居然能生效,哪怕残差「编码」本身就是带噪向量,在每一层都没有内禀结构?

实验用了 20M 参数的 transformer,256 个视觉 patch。(虚线代表「预填充」点,我从这里开始,输入重建结果的前几个 patch)

你可以靠直觉这么理解:它用另一种方式,呈现了渐进去噪的扩散直觉。每个向量本身都带噪声,但累积求和会一步步把你拉向低维数据流形的潜在结构。

在 X 看原帖 ↗
1.4K1613
数字孪生 · @doodlestein▲ 1.2K

AI智能体时代数字孪生结合科学方法潜力巨大

研究者提出通用AI智能体时代数字孪生可结合科学方法

阅读全文 →
1.2K21011
📰 行业动态
行业动态 · @Techmeme▲ 913

投行建议数据中心开发商换杠杆贷款发债

投行预计今年这类杠杆贷款会发行约150亿美元,数据中心赛道的融资玩法开始变了。

来源:Morgan Stanley 正游说数据中心开发商使用杠杆贷款而非债券,并估计今年这类贷款的发行规模将达到约 150 亿美元(出自 The Information)

(前往 Techmeme dot com 获取链接和完整上下文!)

在 X 看原帖 ↗
9131
大模型 · @LottoLabs▲ 270

通义千问27B参数模型,据说顶得上95%人类总智能

这是一位创作者在社交平台给出的个人判断。参数规模270亿的开源大模型,性能已经被不少从业者看好。

我很确定 qwen 27b 相当于 >95% 当前人类智力总和。

在 X 看原帖 ↗
2704
开发工具 · @RoundtableSpace▲ 2.2万

Claude代码子代理,现在能嵌套五层跑完整链路了

每一层都有独立的上下文窗口,只有顶层的结果会返回给主程序,五层是目前的硬性上限。

Claude Code 子代理现在最多支持嵌套 5 层深度,已经有人完整跑通了整条链。

每一层都在自己的上下文窗口中运行。

只有顶层的摘要会返回给主代理,5层深度是硬性上限。

在 X 看原帖 ↗
2.2万2399
工具 · @JinjingLiang▲ 111

第一次拍视频,直接丢给AI剪就完事了

创作者拍完素材后,把所有剪辑工作交给AI完成,明天会放出最终成品。

今天拍了我的第一条视频。现在我把它交给AI来剪辑🤞

明天会发布成品。

在 X 看原帖 ↗
1118
行业观点 · @jun_song▲ 35

从业者觉得,去中心化AI推理才是未来方向

去中心化推理指把AI计算任务分散到多个独立节点完成,而非集中在少数大型数据中心。

我们都知道去中心化AI推理是未来。

在 X 看原帖 ↗
351
大模型 · @stevibe▲ 1.3K

有人在问字节跳动的Seed-2.1-Pro什么时候能开放测试

开发者已经留意到这款大模型更新,目前还没拿到公开测试的资格。

有意思,ByteDance 的 Seed-2.1-Pro,我们什么时候能测试?

在 X 看原帖 ↗
1.3K71
研究 · @odysseus0z▲ 53

研究者训练了强化学习模型来解决管理失当问题

强化学习(RLM)是一种让AI通过试错反馈优化决策的训练方法。

训练了 RLM 来解决天才管理失当问题

在 X 看原帖 ↗
531
行业动态 · @RoundtableSpace▲ 1.1万

一次AI生成就做出三万五千美元级网站

原本需要设计师、动效师和前端开发者协作数周的工作,现在AI一次会话就能完成,成本和时间都大幅降低。

一次AI会话生成出了价值35,000美元级别的网站。

一个看上去就是高级代理商做的落地页,通过Claude Code和Higgsfield从头到尾完整生成了。整个站点的体验是电影级产品体验,而非静态网页。

这套系统产出了什么:
→ 自动生成了完全由滚动驱动的动画布局
→ 从多个生成式视频模型提取动态片段
→ 无需手动设置,自动添加了颗粒、粒子、暗角、玻璃卡片和调色等效果
→ 不需要编写关键帧动画,就生成了滚动行为和节奏

常规情况下制作它需要什么:
→ 设计师、动态艺术家和前端开发协作完成
→ 数周的协调和迭代工作
→ 需要手动对接多个工具来处理滚动、动画和素材

成本差异才是关键转变:
→ 传统代理商建站价格在6,000到35,000美元之间
→ 普通制作项目的成本通常都在5,000美元以上
→ AI生成版本只需要订阅费加少量积分消耗
→ 交付时间从数周缩短到一次会话完成。

在 X 看原帖 ↗
1.1万144
行业动态 · @Nature▲ 181

AI开始让职场人技能退化,先碰到了这些领域

有证据显示,AI驱动的技能退化已经在医学、计算机科学等领域发生。从业者能提前观察到自身技能的变化。

有证据表明,由AI驱动的「去技能化」已经开始出现在医学、计算机科学和其他领域。

在 X 看原帖 ↗
18111
行业动态 · @Discoplomacy▲ 485

英国情报机构最担心的AI风险居然是这个

英国情报机构GCHQ和AI安全机构AISI合作,目前最让GCHQ睡不着觉的AI安全问题,是间接提示注入攻击

GCHQ 与 AISI 展开合作这件事很有意思,GCHQ 在 AI 领域最夜不能寐的问题也同样有意思:那就是间接提示注入。

在 X 看原帖 ↗
48526
行业动态 · @Rainmaker1973▲ 154

索尼AI乒乓球机器人,打赢了职业乒乓球选手

专门开发的AI机器人,已经能在国际乒联官方规则下战胜职业运动员,普通人可以看看AI在体育领域的推进速度

Sony AI 的乒乓球机器人 Ace 在 ITTF 官方规则下击败了职业球员木原美悠。

在 X 看原帖 ↗
15415
大模型 · @juddrosenblatt▲ 2.7万

GLM-5.2在编码测试中性能超过GPT-5.5

有观点提到,头部AI实验室没办法停下来放缓研发速度,为了保住商业模式只能持续训练更大的模型

它们谁都承担不起暂停或放缓发展的代价。只需看看GLM-5.2的能力就能证明这一点。

为了保护自身商业模式,前沿实验室必须不断训练能力越来越强的系统,才能在开源面前、在彼此竞争中保持领先。

冰面之下,水流仍在汹涌奔涌,我们也在继续朝着终点冲刺。

GLM 5.2在编码基准测试中表现超过GPT-5.5。

公布的基准测试结果显示,在聚焦编码的测评中,GLM 5.2的性能提升明显高于GPT-5.5。核心结果包括:SWE-bench Pro得分为62.1,GPT-5.5为58.6;Terminal-Bench 2.1得分为81.0;FrontierSWE得分为74.4%,这让它跻身顶级编码模型行列。

在 X 看原帖 ↗
2.7万3546
职场 · @FurkanGozukara▲ 302

Anthropic CEO承认在用AI替换人类软件工程师

他确认现在AI几乎写完了所有代码,人类工程师只需要做收尾工作

🚨 我去?!Anthropic CEO Dario Amodei随口承认,他自己的公司正在用AI取代人类软件工程师。

他确认,现在几乎所有代码都由AI编写,让人类员工彻底被淘汰。科技精英们是在故意摧毁工人阶级!

在 X 看原帖 ↗
3021
工具 · @Michaelzsguo▲ 26

普通人只花四步就能本地克隆自己的声音了

录30条带提示的语音样本,用LoRA(低秩适配微调技术)微调模型,合并声纹检查点,最后本地部署运行

我训练了一个本地 TTS 模型,克隆了自己的声音。整个流程简单得出人意料:
→录制 30 条带提示的语音样本 → 用 LoRA 微调 MOSS-TTS → 合并语音检查点 → 在本地以兼容 OpenAI 的 TTS API 形式部署 → 在任何需要配音的地方使用我的声音。

真正的测试是给我妻子发了一段配音。

她的回复是:「这完完全全就是你的声音。」

Model:按照这些简单步骤就能克隆你的声音。你需要给智能体提供你自己的声音。

请在下方分享你的体验,或者任何问题/意见。

在 X 看原帖 ↗
262
行业观点 · @tekbog▲ 80

AI现在不只是技术竞赛,还是文化意识形态战争

每个国家都想让自己的AI占据主导,输出自身意识形态。美国现在封闭模型领先,但没人用的话优势也不大

现在每个国家都想让本国的AI占据主导地位,融入自身的意识形态。

美国在闭源模型领域处于领先,但如果没人用这些模型,领先也起不了多大作用。

AI如今也是一场文化战争。

在 X 看原帖 ↗
802
开源 · @bookwormengr▲ 144

有人怼了闭源 labs 指责开源偷代码的说法

闭源实验室称开源项目能做起来全靠偷自家内部代码和文档,有网友吐槽这是新的找借口套路

科技行业动态 · @GoogleCloudTech

Google用多AI系统迁移自身生产级机器学习模型

把机器学习模型从一个框架转到另一个框架,不只是改改语法那么简单

将生产级机器学习模型从一个框架迁移到另一个框架,并不是简单更新语法就能完成的事。

请阅读下文,了解我们如何部署专用多智能体AI系统,将Google部分规模最大的生产模型从TF迁移到JAX ↓

在 X 看原帖 ↗
💡 深度观点
深度观点 · @tekbog▲ 279

Anthropic自己先被监管了,转头喊AI危险

已经处于监管环境下的企业,反过来呼吁全行业加强AI监管。这件事本身值得观察

anthropic 一边告诉所有人AI有多危险、多么需要监管,一边早就已经享受监管红利了。

在 X 看原帖 ↗
2795
深度观点 · @jessegenet▲ 802

一刀切禁止学生用AI 反而拖垮国家发展?

想要处理AI和教育的关系需要更精细的方案,一刀切禁令不是精细选择,为防止学术下滑禁止年轻人接触AI,可能反而造成国家发展下滑。

我们需要一种精细平衡的方法来处理 AI 与教育的关系,但禁令绝非精细平衡。

如果你禁止最年轻的公民接触他们这代人标志性的技术,你原本想要阻止学术滑坡,结果却很容易因此造成国家衰退。

在 X 看原帖 ↗
80251
深度观点 · @haider1▲ 631

谷歌内部对大模型未来分裂,至今仍未聚焦

内部分歧导致同时推进太多方向,人才正在持续流出,战略方向不统一会拖慢AI产品落地进度

我认为 google 现在处境很艰难。问题在于,google 内部有一些团队认为 LLMs 是未来,另一些团队却不这么想,所以他们同时在推进太多项目。

openai 也遇到过同样的问题,但当它开始落后于 anthropic 时,它砍掉了其他项目,重新聚焦核心。

google 还没有完成重新聚焦——这让 openai 和 anthropic 看起来方向更一致,这可能也是知名人士接连离开的原因。

在 X 看原帖 ↗
6314231
深度观点 · @code_star▲ 185

做好数据清洗居然靠这么基础的常识

做数据清洗和生成合成数据时,记住「模型自回归训练」这个基础知识点很重要,很多人会忽略这点。

你一定会惊讶,仅仅记住“模型是自回归训练的”这样简单的一句话,对做好数据清理和合成数据工作来说,居然这么重要。

在 X 看原帖 ↗
18571
深度观点 · @hwchase17▲ 3.6K

这个AI工具居然支持所有通用模型?

它确认该工具不绑定特定模型,是通用工具。

是的,它是模型无关的,而且是通用型的。

在 X 看原帖 ↗
3.6K162
深度观点 · @GaryMarcus▲ 430

大模型真的完全不能产生新想法吗?有人不同意

有人觉得现有关于大模型创造力的说法太绝对。虽然大模型确实很少产生真正全新的想法,但目前没有数学能证明它完全做不到。

依我之见,这种关于创造力的说法太过绝对了。

LLM 确实很少能产生真正新颖的想法,但我认为没有任何数学证明它们不可能产生新想法。

需要注意的是,目标函数和输出并不是一回事。

在 X 看原帖 ↗
43021
⚡ 实战经验
实战经验 · @vincent_koc▲ 743

混合开源闭源模型,已经干翻纯大模型了

有人在优化智能代理的工作中发现,混合不同模型的集成方法效果优于其他所有方案,2026年可能会出现更多这类推理路由模型。

看到通过开放+闭源模型融合构建的神话级模型在编排中正常工作,太震撼了。

我在2025年末研究智能体优化时就见过这种场景,当时LLM集成方案的表现碾压了其他所有方案。

我认为我们会在2026年看到更多推理路由模型。

在 X 看原帖 ↗
743111
实战经验 · @LottoLabs▲ 326

玩本地大模型,别信SOTA模型说的搜索结果

刚入坑本地大模型的人容易踩坑,现有SOTA模型的网页搜索结果不靠谱,得专门调整提示词才能拿到合格结果。

提醒一下,如果你刚开始接触本地模型,你完全不能相信来自SOTA模型的任何输出。

网络搜索已经毁掉它了。你必须专门写提示才能得到像样的结果。

很多人都会被带偏😂

在 X 看原帖 ↗
32671
实战经验 · @TheAhmadOsman▲ 310

不同推理引擎跑大模型,速度差了好几倍

相同硬件换对推理软件,大模型输出token速度能翻数倍,多卡CUDA选对软件提速更明显。

为什么我要聚焦于适配你硬件的推理引擎/软件栈?

两块RTX 3090:原本约14.5 tok/s,迁移到TP=2的vLLM后可达约64 tok/s。

RTX PRO 6000:原本约32 tok/s,迁移到Sglang后可达约110 tok/s。

因此结论是:

CUDA/2块及以上GPU:ExLlamaV3/vLLM/Sglang > llama.cpp

边缘设备:llama.cpp > Ollama

在 X 看原帖 ↗
310107
实战经验 · @DeryaTR_▲ 856

一次生成教父电影网站,国产大模型性能很能打

有人用智谱AI的GLM-5.2一次生成完整站点,它回答生物医学问题的水平接近部分高阶GPT模型,大小控制得很不错。

我用 @Zai_org 的 GLM-5.2 一次性就做出了这个关于《教父》系列电影的网站!

它对生物医学问题的输出质量也非常出色,虽然还没到 GPT-5.5 的水平,但部分回答已经接近 5.2–5.4 层级。

考虑到这个模型的尺寸,能做到这样已经非常了不起了!

在 X 看原帖 ↗
8561102
实战经验 · @Voxyz_ai▲ 169

半年换七款 coding AI,开源款才最实在

从二月到六月,连续更新换代的多款闭源 coding AI里,只有开源权重的GLM最终留了下来

自二月以来我主力使用的编码模型:

Opus 4.6:2月5日
GPT-5.4:3月5日
Opus 4.7:4月16日
GPT-5.5:4月23日
Opus 4.8:5月28日
Fable 5:6月9日(6月12日停服)🪦
GLM-5.2(开放权重):6月16日

说实话,这个开源开放权重的模型意义重大。

在 X 看原帖 ↗
16961
实战经验 · @Ex0byt▲ 186

GLM-5.2能给DGX Spark生成专属CUDA核了

生成的核可以无量化无剪枝全速运行DeepSeek-v4,直接优化GLM-5.2的本地部署服务

从我第一次告诉大家GLM-5.2的能力(而且你们听进去了)至今,已经过去5天了。

现在GLM-5.2正在为DGX Spark生成自定义CUDA内核,让它能够全速运行DeepSeek-v4,无需量化或剪枝。

这直接转化为了GLM-5.2的优化本地化部署服务。

在 X 看原帖 ↗
18615
实战经验 · @jun_song▲ 316

跑本地AI选这些量化格式就对了

根据自己的硬件选推荐的量化格式,就能最大化本地AI的运行速度和性能

针对本地AI格式推荐的量化规格:

- MLX(Mac):6bit+
- NVFP4(Nvidia):4bit
- GGUF(Llama.cpp):4bit+
- DQ(通用):混合 3bit+

请使用适配你硬件的最优优化格式,以最大化速度和性能。

在 X 看原帖 ↗
3166
实战经验 · @hwchase17▲ 1.1K

跟着教程自己搭一个Claude Code平替

社区出了教程,教你用Deep Agents搭建类似Claude Code的智能代理,GLM-5.2效果不错,刚好可以试试

「用 Deep Agents 打造你自己的 Claude Code」

这是社区作者写的一篇好文章,展示了如何用 Deep Agents 构建一个类似 Claude Code 的智能体。

考虑到 GLM-5.2 目前表现相当强劲,这篇文章尤其具有参考意义。

在 X 看原帖 ↗
1.1K21213
📌 其他
前沿研究 · @RoundtableSpace▲ 7.7K

新AI自我进化后,赢了顶尖大模型视觉推理

不同大模型之间的性能差距再次拉大,目前领先模型的优势已经非常明显

基于Hyperagent的Fable 5会为了达成开放式目标持续自我改进数小时,并在视觉推理任务中持续击败Opus 4.8。

模型之间的差距再次变得非常巨大。

在 X 看原帖 ↗
7.7K245
新品发布 · @togethercompute▲ 2.9K

下一代AI推理要用专门定制的基础设施了

Together AI和5C正在部署NVIDIA GB300 NVL72系统,专为大规模AI推理和推理任务配置。

下一代推理需要专为特定用途打造的基础设施。

Together AI 和 5C 正在部署 NVIDIA GB300 NVL72 系统,该系统配备高密度计算、先进散热方案,以及面向 AI 优化的存储,适用于大规模推理和思考。

在 X 看原帖 ↗
2.9K4309
工具产品 · @TheTuringPost▲ 390

整理了10款用于智能体强化学习的开源工具

需要搭建智能体强化学习技术栈,可以从这份现成的工具清单入手找适配工具

适用于智能体强化学习(Agent RL)技术栈的 10 款开源工具 ↓
- OpenPipe ART
- verl-agent
- Agent Lightning
- Unsloth
- OpenRLHF
- SkyRL
- NVIDIA’s Polar
- Agent-R1
- RAGEN
- Marti

收藏这份清单,点击这里获取链接、用例,以及各工具在 Agent RL 技术栈中的定位 →

在 X 看原帖 ↗
39077
开源 · @jerryjliu0▲ 28.3万

开发者推出全球最快更精准的开源PDF转Markdown解析器

开发者发布开源PDF转Markdown解析器LiteParse v2.1,速度精度领先

我们打造了世界上最快的 PDF 转 markdown 解析器 🚀⚡️ 而且在三项标准化基准测试(olmOCR0-bench、opendataloader-bench、ParseBench)中,它的准确率比所有其他开源无模型解析器(pymupdf4llm、opendataloader、pdf-inspector、markitdown)都更高。

现在为你介绍 LiteParse v2.1。v2 基础版已经是全球最快的文档转文本解析器,而在本次新版本中我们加入了 markdown 支持。

它完全开源(Apache 2.0 协议)且免费,可通过 CLI/Rust/Node/Python/WASM 使用,还能作为一键式代理技能安装。

快来体验 LiteParse:

以下是我们的准确率基准测试结果

以下是我们的速度测试结果

在 X 看原帖 ↗
28.3万2011.6K2.3K
AI安全 · @willccbb▲ 2.9K

AI安全核心问题:稳健模型行为评估的形式化自动化

研究者提出AI安全关键问题,团队正推进相关研发

人工智能安全领域最重要的问题,同时也是能让RSI彻底爆发的最大解锁项,就是将鲁棒模型行为评估的科学体系形式化并自动化。

优化器和架构都是很棒的吸引人消遣,RSI肯定也能找出一些漂亮的调整,但真正的大杠杆是评估、数据和内核。而数据和内核本质上都是评估问题,所以说到底其实就只有评估。加上把该死的GPU部署上线。

在@primeintellect,我们正努力为大众规模化扩展评估能力和GPU资源,来加入我们吧。

在 X 看原帖 ↗
2.9K1484
数字孪生 · @doodlestein▲ 1.2K

AI智能体时代数字孪生结合科学方法潜力巨大

研究者提出通用AI智能体时代数字孪生可结合科学方法

阅读全文 →
1.2K21011
计算机视觉 · @kalomaze▲ 1.4K

研究者验证无层级结构噪声残差下残差预测仍有效

20M参数Transformer验证,无层级结构噪声残差仍可实现预测

你们知道吗?next-residual-prediction 居然能生效,哪怕残差「编码」本身就是带噪向量,在每一层都没有内禀结构?

实验用了 20M 参数的 transformer,256 个视觉 patch。(虚线代表「预填充」点,我从这里开始,输入重建结果的前几个 patch)

你可以靠直觉这么理解:它用另一种方式,呈现了渐进去噪的扩散直觉。每个向量本身都带噪声,但累积求和会一步步把你拉向低维数据流形的潜在结构。

在 X 看原帖 ↗
1.4K1613
教育, 数学, 统计 · @xlr8harder▲ 183

博主呼吁高中数学教学优先设置统计学内容

博主称多数人终生用不到积分,统计对决策更重要

我认为如果我们在高中数学教学中将统计学列为优先内容,世界会变得更好。

大多数人终其一生都不需要计算积分,而基础统计学却直接关系到许多重要的人生决策。

在 X 看原帖 ↗
18315
产品发布 · @hardmaru▲ 5.5万

Sakana AI发布Fugu,推进AI集体协作生态发展

Sakana AI发布Fugu,认为协同编排是AI下一前沿,保障AI主权

阅读全文 →
5.5万60417102
创业 · @contextconor▲ 466

创业公司Hyperspell成立 为每家企业打造企业大脑

业内人士预测2030年所有企业都将配备企业大脑

到2030年,公司没有「公司大脑」会变得和现在没有生产数据库一样荒谬。每家公司都会为智能体维护单一可信数据源,事后看来这会是一件理所当然的事。

我们相信,每家公司都理应拥有自己的大脑,不需要投入庞大的工程师团队从零搭建。这就是我们创立@hyperspell的原因:为每家公司打造大脑。

在 X 看原帖 ↗
4662181
大语言模型 · @tekbog▲ 547

网友推测Meta若发布新大模型将是协作型LLM

社交平台用户推测Meta下一款大语言模型为协作办公LLM

如果 Meta 再发布一款新模型,你懂的,它肯定是一款面向职场协作的 LLM。

在 X 看原帖 ↗
547201
多智能体 · @altryne▲ 884

AI初创Sakana发布多智能体编排新技术超预期

Sakana发布类单模型运行的多智能体编排产品,评测表现出色

Sakana 在本周初发布了 AI 公告!多智能体编排可以表现得像单个模型一样,而且……性能超过了 Fable!?

对于一个非前沿实验室来说,这些评测结果有点疯狂(现在它算前沿了?)

在 X 看原帖 ↗
884141
效率 · @Formulasearch▲ 55

关于使用AI多任务处理效率的个人使用感悟

作者分享使用AI多任务的体验,提出专注单任务更高效

我一直觉得ai可以让我同时做多件事情, 但实际上我脑子线程是十分有限的, ai确实是干活快,但很多事一起进行时,我要不停的切换我的思维去审核ai产出的每一条结果,这反而会严重分散我的注意力,根本没有提高效率。 所以不如专注高效的去做好一件事,再开始下一个。

在 X 看原帖 ↗
551

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

▲ Top
把任何一条丢给知识库,它基于全站内容给你带引用的回答。
✦ 去问知识库

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部