AI Pulse
AI Pulse
说人话的 AI 情报站
2026 年 6 月 20 日 08:36 更新 00 信号0 主题
试试:
今日焦点

政府禁了两个AI模型,开发者却更关心技术是否真危险

上周,美国政府对Anthropic发出强制指令:立即下架其两个最新AI模型Fable 5和Mythos 5,理由是国家安全受到威胁。

导火索来自亚马逊研究人员——他们声称找到了一种绕过Fable 5安全护栏的方法。

Anthropic自己随后指出,同样的越狱方法在其他模型上也存在。换句话说,如果禁令的逻辑是“有漏洞就该下架”,那很多模型都该下架。

阅读全文 →

🔥 信号雷达

𝕏 实时信号 + arXiv 前沿论文,经 AI 聚类解读 · 一眼扫完全貌

行业动态 · @swyx▲ 1.7K

AI公司把域名从.ai换成了.com,居然说更清爽

做AI的cognition公司换了顶级域名,就这么简单

cognition.ai → cognition.com 这样更干净简洁

在 X 看原帖 ↗
1.7K11
深度观点 · @LiorOnAI▲ 1.4K

头部前沿AI实验室能给谷歌给不了的东西

想进入AI行业求职的人,可以参考这个差异:新前沿AI实验室能让普通人感受到自己可以直接影响公司走向。

前沿AI实验室正在兜售一件Google难以提供的东西:一个人仍然可以直接改变公司发展轨迹的感觉。

在 X 看原帖 ↗
1.4K1142
实战经验 · @HBCoop_▲ 448

AI智能体自动做完了一整条广告视频

只需要提出一个初始问题,AI就能自主完成调研、规划到生成全流程,省下多环节的人工投入。

我正在测试一个全新的代理型工作流 beta 版本,用于广告创作。它的表现非常惊艳——整个项目始于我给代理提了一个简短问题,之后它自主完成了调研、规划,并生成了完整视频:

在 X 看原帖 ↗
4482102
深度观点 · @thsottiaux▲ 2.1K

Codex支持远程本地切换,需要的基础设施变少了

模型自主调度后,整体运行需要的基础设施反而更少,这改变了原先对AI部署的固有认知

Codex 现已支持远程/本地交接!我们正逐步消除各类边界。

当你让模型占据主导时,你实际上需要更少的基础设施。

在 X 看原帖 ↗
2.1K4659
实战经验 · @bridgemindai▲ 576

不用反复输提示词,AI能自己循环干活了

有人已经用这个方法在生产环境排错,设好目标离开,回来就能看到错误变少了,这比只靠人写提示词更进一步

我刚刚发布了一整支关于用循环进行vibe coding的视频。循环是你只需定义一次的递归目标。代理会一直工作,直到满足停止条件。

不再需要提示、等待、再重新提示。现在我在BridgeSpace的Sentry错误上运行着循环。我设置好目标,离开,等回来的时候生产环境错误已经比我出发时少了。

这是超越提示工程的一步。它也让我们向完全自主的软件开发又迈进了一步。完整视频现已上线。

在 X 看原帖 ↗
57642116
深度观点 · @emollick▲ 9.9K

企业选低价弱AI凑KPI,其实漏了大好处

不少企业觉得弱AI达标又便宜,很少考虑用更强的AI试试效果。建议先搭好能灵活测试更强模型的架构。

我怀疑企业都低估了在那些看起来 weaker AIs 似乎已经足够优秀、能以更低成本达成 KPI 的任务中,使用更高智能的价值。

至少你应该先搭建好架构,让你可以灵活用更智能的模型做实验,看看它能不能带来改变。

在 X 看原帖 ↗
9.9K518128
效率工具 · @mattshumer_▲ 8.7K

博主称可免费分享AI自动安排会议的个人系统

博主发文表示,可免费分享AI处理会议预约的个人系统

如果你有太多会议需要安排,并且想要让 AI 来处理这件事:评论区留言,我会免费把我的个人系统分享给你!

在 X 看原帖 ↗
8.7K237
行业趋势 · @omarsar0▲ 4.6K

研究者分享对AI loop engineering发展趋势的思考

研究者汇总研究讨论,分享对loop engineering趋势的看法

我对「循环工程(loop engineering)」这个趋势有很多想法。我花了几分钟和我的写作智能体(writer agent)一起,整理总结了我的一些研究、笔记,还有我和学生、创始人、初创公司的讨论内容。

目前还处于非常早期的阶段,但随着能力发生阶跃提升,和智能体协作的全新工作方式将会开始涌现。

在 X 看原帖 ↗
4.6K23861
商业 · @LangChain▲ 5.9K

Lyft打造8个AI智能体可解决35%客户问题

Lyft打造8个AI智能体,可全自动解决35%的客户问题

.@Lyft 打造了8个AI智能体,能够完全解决35%的客户问题。

在Interrupt活动上,他们分享了内部使用的评估方法,如何借助LangSmith扩展评估规模,以及一路走来总结出的经验教训。

在 X 看原帖 ↗
5.9K93833
AI开发 · @hwchase17▲ 7.1K

开发者推荐模型无关工具dcode 适配Fireworks AI模型

开发者分享:dcode是模型无关开发框架,建议在其上使用Fireworks AI模型

它确实相当不错!别在 claude code/codex 里试用——这些适配框架过度调优过自家的专有模型。

dcode(deepagents code)是一个模型无关的适配框架,可以搭配 @FireworksAI_HQ 在这里试用:
```
dcode --model fireworks:accounts/fireworks/models/glm-5p2
```

文档:

在 X 看原帖 ↗
7.1K76336
商业 · @emollick▲ 4.1万

泄露财务数据显示OpenAI面向客户业务已实现盈利

泄露数据显示OpenAI客户服务业务盈利,训练成本仍极高

如果泄露的财务数据准确,那 OpenAI 目前已经实现盈利,毛利率超过40%。

但训练成本仍然高得惊人。

将 AI 研究自动化或许也是为了提高训练效率:一个超人类水平的研究者可以用更少资源完成更多工作。

在 X 看原帖 ↗
4.1万2559783
行业观点 · @fchollet▲ 4.7万

François Chollet观点:近期AI与过往技术浪潮无本质区别

François Chollet提出近期AI是数字杠杆,仍需人类参与发挥价值

短期来看,当前的AI从本质上来说和过去的技术浪潮并无不同。它只是数字杠杆的最新形式。

它是力量倍增器,而没有方向的力量不过是噪音而已。它要发挥作用,仍然需要每个环节都有人参与其中。

如果你的公司原本就拥有「面向X领域的软件」,那么它大概率也会拥有「面向X领域的AI」,因为你已经拥有领域专业知识和人力资本,能将AI转化为特定领域的价值。

在 X 看原帖 ↗
4.7万65646108
AI监管 · @IsaacKing314▲ 49

居然有人说靠限制AI训练算力根本没用?

随着AI模型运行效率不断提升,就算卡死总训练算力,也能靠优化做出能力更强的模型,原定的监管思路会失效。

顺便一提,通过限制训练计算量来监管AI能力的尝试,到底出了什么问题?

考虑到效率提升是客观存在的事,这种方式显然行不通,对吧?

在 X 看原帖 ↗
491
AI工具 · @JulianGoldieSEO▲ 70

免费AI工具5小时就能把网站排到谷歌第一

做SEO的人测试了名为Hermes的免费AI智能体,5小时就把站点排名冲到第一,一天能带来180次点击。

动态 · @tunguz▲ 41

AI如果 hallucinate 出脑肿瘤该怎么办?

有人玩AI聊天时觉得一切都好,直到AI帮看诊断报告,凭空虚构出了一个不存在的脑肿瘤。

一切都无伤大雅,直到 AI 凭空给你的大脑造出了一个肿瘤。

在 X 看原帖 ↗
41
开源 · @JulianGoldieSEO

GLM 5.2打破了开源AI的固有玩法

多数人还觉得开源AI需要人一直盯着调整,它已经做到100万token(约75万字)的上下文窗口了。

AI产品 · @WesRoth

xAI给微软Word做了Grok官方插件

可以直接在Word里调用Grok大模型,处理文档里的内容不用跳转到别的平台操作。

xAI 发布了适用于 Microsoft Word 的 Grok 插件。

在 X 看原帖 ↗
AI研究 · @nicdunz▲ 59

普通人也能自己给开源AI智能体做测试

开源项目提供了现成方法,普通人可以用自己常用的工具,测试模型能不能达到你要的智能程度。

它够智能吗?在你自己的工具链上对开源模型做智能体能力基准测试

在 X 看原帖 ↗
592
新品发布 · @JulianGoldieSEO▲ 91

Claude Code新增自动SEO功能,能跑完整个优化流程

测试账号流量获得了明确提升,不用全程盯守,设置好目标就能离开等结果

Claude:新的AI SEO目标更新太疯狂了!Claude Code刚推出了/goal功能——AI SEO完全自动化。⚡

→ 设定可验证条件
→ AI判断器每一步都会检查
→ Claude循环运行直到目标完成

数据验证:
→ 第2天 → 100+次点击/天
→ 第6天 → 69次点击/天
→ 第20天 → 500次点击/天

走开就好。回来的时候已经完成了。🎯

想要标准操作流程?私信我。💬

在 X 看原帖 ↗
91111
📰 行业动态
行业动态 · @swyx▲ 1.7K

AI公司把域名从.ai换成了.com,居然说更清爽

做AI的cognition公司换了顶级域名,就这么简单

cognition.ai → cognition.com 这样更干净简洁

在 X 看原帖 ↗
1.7K11
AI监管 · @IsaacKing314▲ 49

居然有人说靠限制AI训练算力根本没用?

随着AI模型运行效率不断提升,就算卡死总训练算力,也能靠优化做出能力更强的模型,原定的监管思路会失效。

顺便一提,通过限制训练计算量来监管AI能力的尝试,到底出了什么问题?

考虑到效率提升是客观存在的事,这种方式显然行不通,对吧?

在 X 看原帖 ↗
491
AI工具 · @JulianGoldieSEO▲ 70

免费AI工具5小时就能把网站排到谷歌第一

做SEO的人测试了名为Hermes的免费AI智能体,5小时就把站点排名冲到第一,一天能带来180次点击。

动态 · @tunguz▲ 41

AI如果 hallucinate 出脑肿瘤该怎么办?

有人玩AI聊天时觉得一切都好,直到AI帮看诊断报告,凭空虚构出了一个不存在的脑肿瘤。

一切都无伤大雅,直到 AI 凭空给你的大脑造出了一个肿瘤。

在 X 看原帖 ↗
41
开源 · @JulianGoldieSEO

GLM 5.2打破了开源AI的固有玩法

多数人还觉得开源AI需要人一直盯着调整,它已经做到100万token(约75万字)的上下文窗口了。

AI产品 · @WesRoth

xAI给微软Word做了Grok官方插件

可以直接在Word里调用Grok大模型,处理文档里的内容不用跳转到别的平台操作。

xAI 发布了适用于 Microsoft Word 的 Grok 插件。

在 X 看原帖 ↗
AI研究 · @nicdunz▲ 59

普通人也能自己给开源AI智能体做测试

开源项目提供了现成方法,普通人可以用自己常用的工具,测试模型能不能达到你要的智能程度。

它够智能吗?在你自己的工具链上对开源模型做智能体能力基准测试

在 X 看原帖 ↗
592
💡 深度观点
深度观点 · @emollick▲ 9.9K

企业选低价弱AI凑KPI,其实漏了大好处

不少企业觉得弱AI达标又便宜,很少考虑用更强的AI试试效果。建议先搭好能灵活测试更强模型的架构。

我怀疑企业都低估了在那些看起来 weaker AIs 似乎已经足够优秀、能以更低成本达成 KPI 的任务中,使用更高智能的价值。

至少你应该先搭建好架构,让你可以灵活用更智能的模型做实验,看看它能不能带来改变。

在 X 看原帖 ↗
9.9K518128
深度观点 · @thsottiaux▲ 2.1K

Codex支持远程本地切换,需要的基础设施变少了

模型自主调度后,整体运行需要的基础设施反而更少,这改变了原先对AI部署的固有认知

Codex 现已支持远程/本地交接!我们正逐步消除各类边界。

当你让模型占据主导时,你实际上需要更少的基础设施。

在 X 看原帖 ↗
2.1K4659
深度观点 · @LiorOnAI▲ 1.4K

头部前沿AI实验室能给谷歌给不了的东西

想进入AI行业求职的人,可以参考这个差异:新前沿AI实验室能让普通人感受到自己可以直接影响公司走向。

前沿AI实验室正在兜售一件Google难以提供的东西:一个人仍然可以直接改变公司发展轨迹的感觉。

在 X 看原帖 ↗
1.4K1142
⚡ 实战经验
实战经验 · @bridgemindai▲ 576

不用反复输提示词,AI能自己循环干活了

有人已经用这个方法在生产环境排错,设好目标离开,回来就能看到错误变少了,这比只靠人写提示词更进一步

我刚刚发布了一整支关于用循环进行vibe coding的视频。循环是你只需定义一次的递归目标。代理会一直工作,直到满足停止条件。

不再需要提示、等待、再重新提示。现在我在BridgeSpace的Sentry错误上运行着循环。我设置好目标,离开,等回来的时候生产环境错误已经比我出发时少了。

这是超越提示工程的一步。它也让我们向完全自主的软件开发又迈进了一步。完整视频现已上线。

在 X 看原帖 ↗
57642116
实战经验 · @HBCoop_▲ 448

AI智能体自动做完了一整条广告视频

只需要提出一个初始问题,AI就能自主完成调研、规划到生成全流程,省下多环节的人工投入。

我正在测试一个全新的代理型工作流 beta 版本,用于广告创作。它的表现非常惊艳——整个项目始于我给代理提了一个简短问题,之后它自主完成了调研、规划,并生成了完整视频:

在 X 看原帖 ↗
4482102
📌 其他
新品发布 · @JulianGoldieSEO▲ 91

Claude Code新增自动SEO功能,能跑完整个优化流程

测试账号流量获得了明确提升,不用全程盯守,设置好目标就能离开等结果

Claude:新的AI SEO目标更新太疯狂了!Claude Code刚推出了/goal功能——AI SEO完全自动化。⚡

→ 设定可验证条件
→ AI判断器每一步都会检查
→ Claude循环运行直到目标完成

数据验证:
→ 第2天 → 100+次点击/天
→ 第6天 → 69次点击/天
→ 第20天 → 500次点击/天

走开就好。回来的时候已经完成了。🎯

想要标准操作流程?私信我。💬

在 X 看原帖 ↗
91111
行业观点 · @fchollet▲ 4.7万

François Chollet观点:近期AI与过往技术浪潮无本质区别

François Chollet提出近期AI是数字杠杆,仍需人类参与发挥价值

短期来看,当前的AI从本质上来说和过去的技术浪潮并无不同。它只是数字杠杆的最新形式。

它是力量倍增器,而没有方向的力量不过是噪音而已。它要发挥作用,仍然需要每个环节都有人参与其中。

如果你的公司原本就拥有「面向X领域的软件」,那么它大概率也会拥有「面向X领域的AI」,因为你已经拥有领域专业知识和人力资本,能将AI转化为特定领域的价值。

在 X 看原帖 ↗
4.7万65646108
商业 · @emollick▲ 4.1万

泄露财务数据显示OpenAI面向客户业务已实现盈利

泄露数据显示OpenAI客户服务业务盈利,训练成本仍极高

如果泄露的财务数据准确,那 OpenAI 目前已经实现盈利,毛利率超过40%。

但训练成本仍然高得惊人。

将 AI 研究自动化或许也是为了提高训练效率:一个超人类水平的研究者可以用更少资源完成更多工作。

在 X 看原帖 ↗
4.1万2559783
AI开发 · @hwchase17▲ 7.1K

开发者推荐模型无关工具dcode 适配Fireworks AI模型

开发者分享:dcode是模型无关开发框架,建议在其上使用Fireworks AI模型

它确实相当不错!别在 claude code/codex 里试用——这些适配框架过度调优过自家的专有模型。

dcode(deepagents code)是一个模型无关的适配框架,可以搭配 @FireworksAI_HQ 在这里试用:
```
dcode --model fireworks:accounts/fireworks/models/glm-5p2
```

文档:

在 X 看原帖 ↗
7.1K76336
商业 · @LangChain▲ 5.9K

Lyft打造8个AI智能体可解决35%客户问题

Lyft打造8个AI智能体,可全自动解决35%的客户问题

.@Lyft 打造了8个AI智能体,能够完全解决35%的客户问题。

在Interrupt活动上,他们分享了内部使用的评估方法,如何借助LangSmith扩展评估规模,以及一路走来总结出的经验教训。

在 X 看原帖 ↗
5.9K93833
行业趋势 · @omarsar0▲ 4.6K

研究者分享对AI loop engineering发展趋势的思考

研究者汇总研究讨论,分享对loop engineering趋势的看法

我对「循环工程(loop engineering)」这个趋势有很多想法。我花了几分钟和我的写作智能体(writer agent)一起,整理总结了我的一些研究、笔记,还有我和学生、创始人、初创公司的讨论内容。

目前还处于非常早期的阶段,但随着能力发生阶跃提升,和智能体协作的全新工作方式将会开始涌现。

在 X 看原帖 ↗
4.6K23861
效率工具 · @mattshumer_▲ 8.7K

博主称可免费分享AI自动安排会议的个人系统

博主发文表示,可免费分享AI处理会议预约的个人系统

如果你有太多会议需要安排,并且想要让 AI 来处理这件事:评论区留言,我会免费把我的个人系统分享给你!

在 X 看原帖 ↗
8.7K237

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

▲ Top
把任何一条丢给知识库,它基于全站内容给你带引用的回答。
✦ 去问知识库

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部